Está en la página 1de 14

Final

Gestión del Ciclo de vida de la Información

Ejercicios de práctica

Los datos personales

Información de cualquier tipo referida a personas determinadas o determinables


Todo aquello que identifica a la persona
- nombre, apellidos - dirección - voz
- teléfono, mail - edad - imag

Los datos sensibles


Aquellos que revelan origen racial y étnico, opiniones políticas, convicciones religiosas, filosóficas o
morales, afiliación sindical, información relacionada a la salud o vida sexual, antecedentes penales o
datos biométricos

Calidad de datos (art 4).

1. Los datos deben ser ciertos, pertinentes pero no excesivos.


2. Recolección legítima de datos públicos.
3. Finalidad: dejar en claro PARA QUÉ quiero recopilar los datos.
4. Exactos y actualizados: ejemplo cuando se genera una deuda de un banco a un cliente y
cuando se paga no se actualiza esa información.
5. Almacenados para permitir el acceso de las personas de quien son los datos.
6. Deber de eliminarlos cuando dejan de ser necesarios o pertinentes: Normativas de GDPR
obligan a eliminar datos personales cuando una persona ya no sea cliente de la empresa.
7. Deber de responsable de suprimirlos o complementarlos.

Consentimiento (art 5).

El consentimiento debe ser: libre, expreso e informado

Excepciones, es decir, no necesito el consentimiento cuando trata de:

○ Fuentes de acceso público irrestricto


○ Ejercicio de funciones propias del estado u obligación legal
○ Se trate de listados cuyos datos se limiten a nombre, documento nacional de identidad,
identificación tributaria o previsional, ocupación, fecha de nacimiento y domicilio;
○ Deriven de una relación contractual, científica o profesional del titular de los datos, y resulten
necesarios para su desarrollo/cumplimiento (ej: banco requiere mis datos para hacer un crédito)
○ Operaciones de la ley de entidades financieras y de informaciones que reciban de sus clientes

1
Privacidad de datos

Capacidad de individuos para determinar cuándo, cómo y en qué medida la información sobre ellos
se usa o divulga a otros. Los datos se obtienen y se pasan a repositorios centralizados a los cuales
no todos los usuarios internos pueden acceder, esto es para cuidar los datos personales por las
políticas de acceso.

Seguridad de los datos

Son las prácticas que empleamos a través de las personas, procesos y tecnología para proteger la
información, minimizar el potencial de una violacion de datos o compromisos de seguridad.

¿Cómo se administra la seguridad de los datos?

1. Entendiendo los requerimientos de seguridad & privacidad de datos


2. Definir políticas, estándares y controles de seguridad de datos
3. Administrar usuarios, password y grupos membresías
4. Administrar accesos, permisos y monitorearlos
5. Clasificar los datos y auditarlos

Entre los estándares podemos encontrar a:


● Uso de herramientas de seguridad para evitar fuga de datos.
● Mecanismos de encriptación de datos.
● Guías de accesos para proveedores y contratistas externos.
● Protocolos de transmisión de datos en internet.
● Requerimientos documentales.
● Estándares de accesos remotos.
● Procedimientos de gestión de incidentes de seguridad.
● Acceso a los datos en el uso de medios móviles (ej.: celulares, tabletas).
● Almacenamiento de datos en dispositivos portables como laptops, DVD.
● Cumplimiento de reglas de administración de registros.

Técnicas para desarrollar una estrategia de


privacidad
1. copia de seguridad y recuperación
2. movimiento remoto de datos
3. seguridad del sistema de almacenamiento
4. data lifecycle management (DLM)

Técnicas para desarrollar una estrategia de


seguridad
Gestión de accesos Antivirus
Protocolos criptográficos Política de seguridad
Autenticaciones / de segundo factor Capacitación
Network intrusion detection systems Data Masking

2
Estados del dato
Hay muchas formas de clasificar los datos, una es dependiendo de los estados del dato:

1. CRUDOS: todavía no fueron sujetos a transformaciones,

Maestros: se recopilan de las personas. Son el corazón de la organización, existen porque la


organización existe, describen sus entidades. (Ej: clientes, proveedores, información de los
participantes, cuentas en bancos, etc)

Referenciales: Es cualquier tipo de datos utilizados para clasificar otros elementos de datos.
Son los códigos de cada producto o cliente, útiles para categorizar a otros. Categorizan a
otros dentro de la empresa y son requeridos para crear los transaccionales.
(Ej: lista de códigos, jerarquías de productos, etc)

Transaccionales: aquellos datos que surgen de las transacciones; por ejemplo, venta,
transferencia, logística, compra. Cambian todo el tiempo. Son generados por las
transacciones que se relacionan de distintas maneras al negocio (Ej: facturas, órdenes de
compra, etc)

2. VALIDADOS: han sido objeto de procesos de transformación/enriquecimiento para poder ser


utilizados con mayor calidad.

Bajo el concepto de CALIDAD, este es un componente muy importante


para una organización data-driven.

3. AGREGADOS: incluye las métricas de negocio, son medidas que se utilizan para cuantificar
el rendimiento o el progreso.

Para crear una métrica se combinan otros datos en pos de un objetivo planteado. Es un
dato crudo que es transformado para cumplir específicamente con un objetivo planteado

4. SMART: métrica de negocio puesta a disposición de un objetivo de negocio. Por ejemplo los
KPI. Muchos de estos son utilizados en tiempo real.

3
Arquitectura Empresarial

La arquitectura es un acuerdo organizado de componentes, que optimizan la función, performance,


factibilidad, costo y/o estética de una estructura general o sistema.

Capas del modelo warehouse

DISPOSICIÓN
CAPTURA
ALMACENAMIENTO

CONSU
MO

(1) Data Warehouse


Es un sistema que agrega y combina información de diferentes fuentes en un almacén de datos
único y centralizado. Desde el central Warehouse tengo salida de datos a:

● ODS (operational data store): Proporciona una interfaz o plataforma central para todos los
datos operativos utilizados por los sistemas y aplicaciones empresariales. Está diseñado para
integrar datos de múltiples fuentes con los que realizar operaciones.

● Data Marts: Agrupo en áreas temáticas (de finanzas, de contabilidad, etc). Un data mart es
una versión específica del data warehouse centrados en un tema o un área de negocio dentro
de una organización.

● Cubes: pre-procesa y deja listo para ser utilizado. A partir de ahí se hacen reportes o
dashboards. Un cubo es una estructura de datos que supera las limitaciones de las bases de
datos relacionales y proporciona un análisis rápido de datos. Los cubos pueden mostrar y
sumar grandes cantidades de datos, a la vez que proporcionan a los usuarios acceso.

Master Data Management (MDM)


Un MDM es el conjunto de metodologías, herramientas y procesos, necesarios para crear y
mantener conjuntos precisos y consistentes de datos maestros. De esta forma se identifica la
información más importante de una empresa, creando una única fuente de la verdad.

Asegurar a los usuarios de negocio que los datos listos para su consumo son precisos, consistentes
y están actualizados.

4
(2) Big Data

En la arquitectura del Big Data se realiza el proceso de ETL y se evalúa el modelo. Por eso, el primer
componente es Ingest, donde se ingresan los datos y se vuelcan en el Data Lake. El Data Lake es
una solución flexible de administración de datos donde se encuentran lo más desagregados y
voluminosos posibles y están orientados a un análisis científico. Luego se Integra, se Explora y, por
ultimo, se Evalúa el Modelo.

En big data la información está en su estado más cruda, no hay mucho dato agregado ni mucho
segmentado por cliente. Consume muchos recursos y es complejo por lo que no es algo que se
puede democratizar tanto en la organización.

Maneja información estructurada y no estructurada. El mismo Datawarehouse puede nutrir al big


data. A partir de esa información se puede visualizar.

Data Lake
El concepto de data lake entra con el de big data: destinado a mucha información. Es una solución
flexible que permite explorar de una manera rápida grandes volúmenes de datos, con costo muy
bajo. Permite hacer pruebas de ensayo y error muy fácilmente. No es un reemplazo de DW.

Un data lake es un repositorio de almacenamiento que contiene una gran cantidad de datos en bruto.
Son soluciones de gestión de datos híbridos de última generación que pueden hacer frente a los
retos de big data y que impulsan nuevos niveles de analítica en tiempo real.

En la capa de big data tengo una ingesta de información, lo integro, lo exploro y hago modelos.
A partir de un DL yo puedo explorar, evaluar modelos analíticos de ciencia de datos, y a partir de ahí
puedo los visualizo, hago minería, o machine learning.

Data lake vs Data warehouse:

Lake: mas info, mas barato, no estructurado, big data. Es para cosas más de data scientist o analyst.
Predictivo y prescriptivo.

Warehouse: Estructurado y orientado al negocio, más focalizado. Suele estar creada de manera
relacional y estructurada. Es menos flexible que un lake.
Descriptiva y de diagnóstico

5
Metadata
Es la información que describe datos reales en sí mismos. Es todo aquello que define el dato.

Las perspectivas son:

(1) Negocio: Presentación de los metadatos para el usuario de negocio de manera tal que entiendan
los datos, y pueda tomar decisiones estratégicas de negocio.

- Modelo conceptual
- Modelo lógico de datos
- Dominio de negocio
(términos y conceptos)
- Subdominio
(elemento de datos)
- Reglas de negocio
- Atributos
- Entidad

Ej: contacto del cliente compuesto por mail y teléfono, datos de ubicación compuesto por nombre,
apellido del cliente, calle, número, localidad, estado, país. datos sociodemográficos

(2) Técnica (subconjunto estructural): Explicación de los datos a los responsables de la


planeación de los sistemas. Se necesita información de origen y extracción, reglas para el ETL.

Se habla de keys, columnas donde está, campos, fuente principal, reglas definidas para el dato,
nombres bajo los cuales puede ser accedido.

- Modelo físico
- Tabla
- Campo/columnas
- Sistema
- Modelo físico de datos
- Regla de movimiento de datos
- Programa de movimiento de datos

(3) Operacional/de navegación: describen la relación de datos y sus movimientos dentro de los
ambientes. Cómo se transforma el dato, explicar qué reglas de transformación hay, bajo qué tipo de
consulta. ¿Cómo corre y se ejecuta ese dato en la diaria?

Profesionales de operacion usan metadatos para verificar el estado de los procesos de carga de datos

- Sistema
- Interfaz
- Job
- Resultado de ejecución del job

ejemplo: campos derivados, Apis, como se consume esa APi.


Comprensión de la data desde un proceso más físico.

6
Calidad del dato
Roles, estructura organizacional, procesos de monitoreo, medidas, remediación de issues de calidad,
políticas, procesos y procedimientos que impulsen la gobernabilidad de la información.

OBJETIVO
- Proporcionar los procesos, procedimientos y elementos de apoyo a la organización para la
construcción y el mantenimiento de las capacidades de gobernanza mejorada de datos.
- Definir y gestionar los estándares de datos para elementos de datos afectados por problemas
priorizados de calidad de datos
- Proporcionar controles periódicos y seguimiento de la calidad
- Definir arquitectura de información y las necesidades tecnológicas

Dimensiones técnicas de calidad de datos

VALIDEZ
Dato cumple con las validaciones implementadas. Asociada al tipo de dato técnico
(ejemplo 1) Un mail está escrito violetasaguier&gmail.com en vez de con @. Teléfono mal escrito: 4101-rt71.

UNICIDAD
El dato es único, no habrá uno repetido que valga lo mismo (no existen valores duplicados)
(ejemplo 1) dos códigos de cuenta en el mismo archivo maestro / un mismo código para dos productos distintos
/ un mismo lugar clasificado como dos cosas distintas

COMPLETITUD
El dato debe estar completo. Es siempre requerido basado en la condición de otro dato.
(ejemplo 1) Si el registro de un cliente viene sin dirección de habitación / O, si falta un dato

CONSISTENCIA
No hay contradicción con la definición de ese elemento.
(ejemplo 1) Mail mal escrito / La fecha de transacción es anterior a la fecha de apertura de la cuenta /
(ejemplo 2) Fecha de depósito anterior a la fecha de apertura de la cuenta

OPORTUNO
Problema de oportunidad. El dato representa información reciente producto de un evento del negocio
(ejemplo 1) Dirección o email desactualizado implica un problema de oportunidad.
(ejemplo 2) Fecha desactualizada.

EXACTO
El dato tiene un valor asignado correctamente (no puedo clasificar a una persona de 20 años como
jubilado, problemas de sesgo). La exactitud de clasificación dado un dato.
(ejemplo 1) “posee la casilla llena” porque es probable que la casilla no se esté usando.

PRECISO
El dato es solo usado para el propósito que se dió. Es decir, las características de un dato son bien
entendidas y correctamente utilizadas.
(ejemplo 1) Códigos de producto usados para diferentes propósitos en diferentes registros.
(ejemplo 2) Dos productos distintos con un mismo código de identificación

¿Cómo se analiza la calidad? Con distintos análisis en distintos niveles:

7
8
Segunda Parte

Roles y responsabilidades

Visión: Comité
Comunicar la visión de la empresa, mostrar compromiso y poder comunicar la importancia del
gobierno de datos y la necesidad de participación.

Foco: Oficina de Gobierno de Información


Comprender requerimientos del gobierno de datos, ejercer prácticas, definir procesos. Coordinar la
asignación de datos, ejercer prácticas, definir procesos. Priorizar problemas de alto impacto.

Responsabilidad: Dueños de información


Velar por el cumplimiento de las políticas, estándares y lineamientos de las diferentes dimensiones
relacionadas con la información.

Facilitadores: Gestores de información


Establecer las definiciones, reglas, y calidad requerida. Resolver inconvenientes referente a accesos,
disponibilidad y uso de los datos.

Soporte: Custodios de información


Proveer acceso a sistemas y herramientas. Proveer documentación del sistema y coordinar los
cambios requeridos sobre los mismos. Proveer información sobre análisis de calidad. Facilitar
análisis sistémico. Auditar, controlar y garantizar arquitectura.

Acompañado por roles centralizados y descentralizados:

9
Arquitectura Empresarial (IT)
Área vertical gris del medio
➔ Conjuntos de dueños, gestores y custodios en IT.
➔ Tienen su propia lógica de negocio.
➔ Las áreas de IT de las organizaciones tienen equipos que están integrando datos.
➔ Construyen integraciones.
➔ El equipo de plataforma o infraestructuras monitorean que todos los ETL estén funcionando.
➔ Conocen todas las aplicaciones y deben controlar el ecosistema de tecnologías.

Oficina de Gobierno de Datos


➔ Es un chief data officer u oficina de gobierno que depende del CDO
➔ Es el punto intermedio que se necesita, dado que une al negocio con IT
➔ Roles: Data Governance Analyst → Equipo metadata data / Equipo ciclo de vida
Data Governance Tech → Calidad / Seguridad junto con IT
➔ Proyectos: Definición de metadata y de modelos nuevos
Empezar a: capturar info y definir calidad donde no está definida

Dueños de los procesos de Negocio Fuente


➔ Es importante que la oficina de gobierno y la arquitectura empresarial trabajen en conjunto.
➔ Oficina del gobierno y CDO están a nivel de negocio.
➔ Se tienen niveles de manera horizontal y vertical.
➔ Son los responsables de todo el dato

Dueños de los procesos de Analytics


Columna de la Derecha
➔ Área centralizada, trabajando dentro de la oficina del CDO.
➔ Todo integrado debe funcionar bien, se debe conocer los modelos de datos.

Gestores de Datos
Data Stewards
10
➔ Metidos en las aplicaciones y hace las definiciones del dato en el día a día
➔ Analista de datos que trabajó con reportes y define metadata y que se cumplan los controles
que se hacen.

Custodios de datos fuentes


➔ Nivel de negocio/IT, no está en todas las organizaciones
➔ Responsable por algún atributo en algún proceso específico, la validez o exactitud, o
componente en ciclo de vida o calidad.
➔ Son de operación
Gestores o Facilitadores
- Analista sr que la tiene muy clara con datos (en gnrl)
- Ayuda al dueño de clientes a entender el mundo de datos
- Facilitador
- Más responsabilidades

Otras áreas que tienen roles basados en datos:

Áreas de inteligencia comercial


Inteligencia de negocio

- Generar una segmentación estratégica del cliente


- Detectar necesidades
- Integrar data para desarrollar insights
- Medir y analizar resultados de campañas
- Capturar interacción web y redes sociales
- Análisis predictivo
- Detectar y definir eventos del cliente que disparen campañas

- Análisis de mercado
- Estrategia de producto
- Ejecución de campañas

11
Procesos y procedimientos
enfocado en la medición operativa y de disciplinas de soporte:
➔ supervision y revision del modelo de gobierno
Administrar oficina de gobierno de datos, definir políticas operativas de gobierno, evaluar
efectividad del modelo, aplicar mejoras en el modelo operacional de gobierno.

➔ definición y admin de datos (capturar, administrar, controlar)


Crear definiciones de información estratégica, modificarlas y mantenerlas definidas.

enfocado en las disciplinas core:


➔ definición y monitoreo de disciplinas core
Definir calidad/ciclo de vida, seguridad de activos, monitorear y corregir.

enfocado en la operatoria diaria:


➔ escalamiento de issues y resolución
Identificar issues en la definición y gestión de activos, escalar issues, resolverlos.

Herramientas de soporte

Politicas y estandares

12
Una política de gestión de la información provee dirección estratégica y operacional, como un marco
de trabajo para tomar decisiones cuando existan puntos de vista en conflicto.

Dirige
Son guías y direcciones en caso de ausencia de una línea directa de autoridad

Estandariza
Asegura que las personas no tengan que seguir discutiendo los mismos asuntos; mayor eficiencia.

Asegura
Asegura el buen cumplimiento del Programa de Gestión de la Información

Mejores prácticas de documentación:


Documentación en Cascada Doble

Primera cascada
- Qué necesita hacerse y documentarse para concretar determinado trabajo
- Se compone de declaraciones, procesos, procedimientos y registros de control

Segunda cascada
- Qué necesita hacerse y documentarse para estar en cumplimiento con requerimientos
legales y organizacionales
- Proviene de regulaciones, leyes, temas de seguridad, o necesidades específicas de la
empresa

13
Enfoque de la gestión del cambio

1. estrategia y gestión del programa de cambio elaboración de un plan integral de cambio que
acompañe los objetivos del proyecto

2. programa de liderazgo desarrollo de una red de líderes para involucrar a todas las áreas

3. impacto organizacional identificación y evaluación de impactos organizacionales por la


ejecución de los proyectos

4. gestión de las comunicaciones diseño e implementación de una estrategia y plan de


comunicaciones, comunicar avances e impactos

a. construir el compromiso, mantener las expectativas, obtener retroalimentación, dar


info continua sobre el proyecto, avances e impactos y dar formación sobre diferentes
aspectos del proyecto

5. gestión de transferencia de conocimiento y aprendizaje definición de una estrategia de


capacitación y atienda las necesidades de aprendizaje de proceso y tecnología

a. Identificar los componentes clave que serán parte del programa de capacitación

6. gestión y compromiso de stakeholders diseño e implementación de una estrategia que


permita identificar a los impactados clave de la organización para lograr compromiso y
soporte

Foco en ejecución estratégica


Foco en cambio de las personas

14

También podría gustarte