Está en la página 1de 28

MODULO I

INTRODUCCION A GESTION DE LA INFORMACION

Docente: Carmen Ortega Rodríguez


Análisis y la interpretación de resultados en
1
las diferentes áreas del conocimiento 2

Introducción al Curso 2 Interpretación de datos:


• Clínicos
• Económicos
• Sociales
• Ingeniería
• Otros

3 Tipos de Análisis
• Estadística descriptiva o análisis
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
preliminar de los datos
• Predecir
• Asociar
• Clasificar
• Interpretar y Analizar
Tipos de Datos 3

1 Variables cuantitativas:
Definidas en valores numéricos como la
Introducción del Curso edad, porcentajes o cualquier valor
numérico.
2 Variables cualitativas:
Definidas en categorías tales como
género, estado civil, y cualquier otra
variable que pueda agruparse en
categorías.
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
3 En el ámbito de la ingeniería estudiar
todo tipo de información, por ejemplo
analizar datos meteorológicos,
información sísmica, georreferenciación,
otros.
Herramientas para Análisis
4

1 Existen herramientas de uso libre


Introducción al Curso como licenciadas para el
tratamiento y análisis de los datos.

• Weka
• R
• Matlab
• Python
Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC
• SAP
• SAS
• Excel
• Otras
Herramientas a la medida
5

1 Herramientas creadas para el


Introducción del Curso análisis de datos de manera
particular, por ejemplo para
cálculo de fuerzas sísmicas,
análisis sísmicos de túneles,
predicción de terremotos, otros.

Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC


2 De manera particular se puede
encontrar gran variedad de
herramientas computacionales
para estos análisis.
Análisis de Datos 6

Esta foto de Autor desconocido está bajo licencia CC BY-SA-NC


Capítulo I Toda Organización, Institución o
1 7
Empresa opera bajo decisiones
1.1 Introducción a la gestión resultantes de la información que
maneja.
de los datos e información
2 Información:
Conjunto de datos preparados y
organizados, los cuales deben ser
administrados, planificados y
controlados.

3 Dato:
Recurso vital dentro de una
Organización y como todo recurso tiene
un costo y un valor asociado
Capítulo I 1 Base de Datos 8

Se diseña, construye y puebla datos


1.1 Introducción a la gestión
de los datos e información para un propósito específico.

2 Posee 2 funciones importantes:


• Integrar
• Compartir
9
Desventajas del Enfoque Tradicional de 10

Procesamiento de Datos
Estandarización
Inflexibilidad
deficiente

Redundancia no
controlada Excesiva
Mantención

Escasa posibilidad
de compartir
datos
Baja
productividad del
Inconsistencia de programador
datos
Capítulo I 1 Enfoque de Base de Datos 11

Sistema que permite la


1.1 Introducción a la gestión
organización, modificación e
de los datos e información
integración de datos en forma
óptima, dando la posibilidad de que
no haya redundancia en los tipos
de datos incluidos.
2 En el enfoque de base de datos se
mantiene un único almacén de
datos que se define una sola vez y
al cual tienen acceso muchos
usuarios
Capítulo I 1 Características – Enfoque de Base de 12
Datos
1.1 Introducción a la gestión Una características fundamental del enfoque de
base de datos, es una definición de los datos
de los datos e información almacenados en esta. Se almacena en un catálogo
que contiene información y restricciones que se
aplican a los datos. Adicional, a esta información se
le denomina “METADATOS” y éstos describen la
estructura de la base de datos.
2 El catálogo es utilizado por el software del DBMS y,
en ocasiones por los usuarios de la BD que
necesitan información sobre la estructura de esta
última.
3 El software del DBMS no esta escrito para una
aplicación de BD específica, así que tiene que
consultar el catálogo para conocer la estructura de
los archivos de una base de datos en particular,
como el tipo y formato de los datos que tendrá
acceso.
Capítulo I 1 Enfoque de Base de Datos 13

Características
1.1 Introducción a la gestión Una características fundamental del enfoque de
base de datos, es una definición de los datos
de los datos e información almacenados en esta. Se almacena en un catálogo
que contiene información y restricciones que se
aplican a los datos. Adicional, a esta información se
le denomina “METADATOS” y éstos describen la
estructura de la base de datos.
2 El catálogo es utilizado por el software del DBMS y,
en ocasiones por los usuarios de la BD que
necesitan información sobre la estructura de esta
última.
3 El software del DBMS no esta escrito para una
aplicación de BD específica, así que tiene que
consultar el catálogo para conocer la estructura de
los archivos de una base de datos en particular,
como el tipo y formato de los datos que tendrá
acceso.
Capítulo I 1
1 Abstracción de datos 14

Los programas de acceso del DBMS se


1.1 Introducción a la gestión escribe en modo que sean
de los datos e información independientes de los archivos
específicos.
2 La estructura de los archivos de datos se
almacena en el catálogo del DBMS
separada de los programas de acceso.
3 Llamamos a esta propiedad
independencia con respectos a los
programas y datos.
Capítulo I 1 Compartir datos y procesamiento de 15
datos multiusuario
1.1 Introducción a la gestión Todo DBMS multiusuario debe permitir a
de los datos e información varios usuarios tener acceso simultáneo
a la BD.
2 Es indispensable para que los datos de
múltiples aplicaciones se integren y
mantengan en una sola BD.
3 El DBMS debe incluir un SW de control
de concurrencia para asegurar que,
cuando varios usuarios intenten
actualizar los datos, lo hagan de manera
controlada para que el resultado de las
actualizaciones sea correcto.
Capítulo I 1 Control de Redundancias 16

En la creación tradicional de programas


1.1 Introducción a la gestión con procesamiento de archivos, cada
de los datos e información grupo de usuarios mantiene sus propios
archivos para manejar sus aplicaciones
de procesamiento de datos.
2 Por ejemplo, la oficina de contabilidad y
la de ventas. Una buena parte de los
datos se almacenaría dos veces, una vez
en los archivos de cada grupo de
usuarios.
Ventajas del Enfoque Base de Datos 17

Independencia de Hacer cumplir las


los datos normas

Equilibrar Compartir los


requerimientos datos
opuestos

Mantener la Evitar la
Integridad inconsistencias

Aplicar
Disminuir la
restricciones de
redundancia
seguridad
¿Qué es Data Quality?
Capítulo I 1
18
❑Data Quality es la práctica de
1.1 Introducción a la asegurarse de que los datos sean
gestión de los datos e precisos y útiles para un propósito
información determinado.
❑Al igual que la gestión de la calidad
ISO 9000 en el sector de
manufactura, la calidad de los datos
debe aprovecharse en cada paso del
proceso de gestión de datos.
❑Esto comienza desde el momento en
que se tiene acceso a los datos, a
través de varios puntos de integración
con otros datos, e incluye el punto
antes de que sean publicados,
reportados o se haga referencia a
ellos en otro destino.
¿Qué es Data Quality?
Capítulo I 1
19
❑Data Quality es la práctica de
1.1 Introducción a la asegurarse de que los datos sean
gestión de los datos e precisos y útiles para un propósito
información determinado.
❑Al igual que la gestión de la calidad
ISO 9000 en el sector de
manufactura, la calidad de los datos
debe aprovecharse en cada paso del
proceso de gestión de datos.
❑Esto comienza desde el momento en
que se tiene acceso a los datos, a
través de varios puntos de integración
con otros datos, e incluye el punto
antes de que sean publicados,
reportados o se haga referencia a
ellos en otro destino.
¿Por qué es importante el Data Quality?
2
Capítulo I Es muy sencillo almacenar datos, pero ¿cuál es el 20

1.1 Introducción a la valor de esos datos si son incorrectos o no son útiles.


Un ejemplo sencillo:
gestión de los datos e ❑ Un archivo con el texto “CALLE PRINCIPAL 123
información Cualquier Pueblo, AZ 12345”.
❑ La computadora puede almacenar esta
información y proporcionársela a un usuario, pero
sin ayuda, puede determinar que este registro es
una dirección, que es parte de la dirección, es el
estado, o si el correo enviado a la dirección llegará
a su destino.
❑ Corregir un registro único es fácil, ¡pero no lo es si
intenta realizar este proceso en cientos, miles o
incluso millones de registros!
❑ Es mucho más rápido utilizar una solución de
calidad de datos que pueda estandarizar, analizar y
verificar de una forma consistente y automática.
❑ Al hacerlo en cada paso, pueden eliminarse los
riesgos, como es enviar correo a la dirección
errónea del cliente.
3 ¿Qué es Data Integration?
Capítulo I ❑ Una vez que usted ha tenido acceso a los datos, 21

1.1 Introducción a la ¿qué puede hacer con ellos?

gestión de los datos e ❑ Un siguiente paso muy común es combinarlos con


otros datos para presentar resultados unificados.
información ❑ La integración de datos es el proceso que define
los pasos para hacer esto, y las herramientas de
integración de datos ayuden a diseñar y
automatizar los pasos que realizan este trabajo.
❑ Las herramientas de integración de datos más
comunes son conocidas como ETL, que es el
acrónimo de extraer, transformar y cargar, y ELT,
que a su vez es el acrónimo de extraer, cargar y
transformar.
❑ Actualmente, la integración de datos no se limita a
los movimientos entre las bases de datos. Con la
disponibilidad de los servidores en la memoria,
usted podría estar cargando los datos
directamente en la memoria, lo que evita
totalmente a las bases de datos tradicionales.
4 ¿Por qué es importante el Data Integration?
Capítulo I 22

1.1 Introducción a la La integración de datos es lo que permite a las


gestión de los datos e organizaciones crear combinaciones de datos que son
más útiles para tomar decisiones.
información
Ejemplo:
❑ Un conjunto de datos podría incluir una lista de todos
los nombres y sus direcciones.
❑ Otro conjunto de datos podría ser una lista de la
actividad en línea y los nombres de los clientes.
❑ Por sí mismo, cada conjunto de datos es relevante y
puede decirle algo importante.
❑ Pero cuando usted integra elementos de ambos
conjuntos de datos, puede comenzar a responder
preguntas como, “¿Quiénes son mis mejores clientes?”
“¿Cuál es la próxima mejor oferta?”
❑ Combinar información clave de cada conjunto de datos
le permitiría crear la mejor experiencia del cliente.
5 ¿Qué es Data Federation?
Capítulo I 23

1.1 Introducción a la ❑ Data federation es un tipo especial de


integración de datos.
gestión de los datos e
❑ Los tipos de integración de datos ETL y
información ELT combinan datos y los almacenan en
otro sitio para usarlos, en el pasado era
en un datamart o en un almacén de
datos.
❑ Pero, ¿y si usted únicamente quiere ver
los resultados combinados sin la
necesidad de moverlos o almacenarlos
con anticipación?
❑ La federación de datos ofrece la
capacidad de hacer eso, lo que le permite
a tener acceso a los datos combinados en
el momento que se solicite. .
6 ¿Por qué es importante el Data Federation?
Capítulo I ❑ Si bien muchas herramientas de integración de datos 24

ETL y ELT pueden trabajar muy rápidamente, sus


1.1 Introducción a la resultados sólo pueden representar una imagen de lo
que sucedió en un punto en el tiempo cuando el
gestión de los datos e proceso se realizó.
información ❑ Con la federación de datos, se genera un resultado
basado en la forma en que lucen los datos en el
momento en que se solicita el resultado.
❑ Esto permite tener una vista de la información más
oportuna y mucho más precisa.
❑ Imagine que usted está comprando un regalo para un
ser querido en una tienda. Cuando paga, recibe una
oferta de otro producto que complementa el regalo que
usted eligió y resulta ser algo que su ser querido
disfrutaría.
❑ Aún mejor – el producto está en existencia en la misma
tienda. Gracias al análisis en tiempo real de los datos
de la próxima mejor oferta y de los datos de ubicación,
la tienda mejora su experiencia de compra al hacerle
llegar una oferta conveniente y relevante en el
momento correcto en el lugar correcto.
Capítulo I 7 ¿Qué es Data Governance? 25

1.1 Introducción a la ❑ Data Governance es el ejercicio de la


autoridad para tomar decisiones sobre los
gestión de los datos e procesos que gestionan los datos de su
información organización.
❑ En otras palabras, es asegurarse de que su
estrategia de datos esté alineada con su
estrategia de negocio
8 ¿Por qué es importante el Data
Capítulo I Governance? 26

1.1 Introducción a la ❑ El gobierno de datos comienza haciendo preguntas y


desarrollando políticas alrededor de las respuestas:
gestión de los datos e ❑ ¿Cómo utiliza su organización los datos? ¿Cuáles son las
limitaciones con las que usted trabaja? ¿Cuál es el entorno
información regulatorio? ¿Quién tiene la responsabilidad de los datos?
❑ Una vez que las respuestas a estas preguntas se conocen,
pueden definirse las reglas para aplicarlas.
❑ Ejemplos de tales reglas podrían estar definiendo a qué datos
pueden acceder los usuarios, qué usuarios pueden cambiar
los datos versus simplemente verlos, y cómo se manejan las
excepciones a las reglas. Se pueden utilizar entonces
herramientas de gobierno de datos para controlar y gestionar
las reglas, perfilar cómo se manejan, y generar reportes para
propósitos de auditoría.
❑ El aspecto de auditabilidad de esto es probablemente el más
vital, pues los líderes de las organizaciones tienen que
refrendar la precisión de los reportes financieros para los
consejos de gobierno, los accionistas, los clientes y las
instancias gubernamentales.
❑ Es una gran responsabilidad y si no se maneja correctamente,
corre el riesgo de ser censurado, exponerse a recibir fuertes
sanciones e incluso a una acción legal.
9 ¿Qué es Master Data Management?
Capítulo I 27

1.1 Introducción a la
❑ Master data Management (MDM) es un conjunto de
gestión de los datos e procesos y tecnologías que definen, unifican y
información gestionan todos los datos que son comunes y
esenciales para todas las áreas de una
organización.
❑ Estos datos maestros son gestionados típicamente
desde un solo lugar, a menudo denominado un
centro de gestión de datos maestros, el cual actúa
como un punto de acceso común para publicar y
compartir estos datos críticos a lo largo de la
organización de una manera consistente.
8 ¿Por qué es importante el Master Data
Capítulo I Management? 28

❑ Fácil: Porque asegura que diferentes usuarios no estén


1.1 Introducción a la utilizando diferentes versiones de los datos comunes y
gestión de los datos e esenciales de la organización.
❑ Sin MDM, un cliente que compra un seguro de una
información compañía podría seguir recibiendo ofertas para
comprar un seguro de la misma aseguradora.
❑ Esto sucede cuando la información gestionada por la
base de datos de relaciones con los clientes y la base
de datos de marketing que no están ligadas, lo que
genera dos registros distintos de la misma persona – y
un cliente confuso e irritado.
❑ Con la gestión de datos maestros, todos los sistemas
organizacionales y las fuentes de datos pueden
vincularse y gestionarse de forma consistente
continuamente para asegurar que los datos maestros
utilizados por la organización sean siempre
consistentes y precisos. En el mundo del big data, MDM
también puede automatizar la manera en que se
utilizan ciertas fuentes de datos, qué tipos de modelos
analíticos se aplican, en qué contexto se aplican y las
mejores técnicas de visualización para sus datos

También podría gustarte