Está en la página 1de 29

Inteligencia

de negocios
Semana 2

Maestra. Rosa Elena Reyes Moreno


Objetivo de aprendizaje

Identificar los procesos para la obtención de datos que han sido


creados por una fuente interna o externa de la organización, para
conocer desarrollo de los procesos de identificación, obtención,
comprensión, evaluación y toma de decisiones.
Adquisición de datos

El proceso de Canalización
de datos de ELT es popular
Manejo de datos que ayudan a entre muchos científicos de
un análisis integral para la datos porque creen que es más
toma de decisiones. fácil transformar los datos una
vez que se replican en el
almacén de datos de destino.
EXTRACCIÓN TRANSFORMACIÓN CARGA
Macrodatos

La información que no se puede procesar por metodologías


tradicionales se conocen como Macrodatos.

Su procesamiento se realiza mediante programas


automatizados.
Consolidación de datos
▪ Es la recopilación,
acorralamiento,
combinación de datos
variados en un solo lugar.
▪ Permite al usuario la
manipulación de
información desde un
punto de acceso.
▪ Ayuda a procesar los datos
en conocimientos para una
óptima toma de decisiones.
Ejemplos concretos

▪ Amazon procesa la información de


su base de datos de clientes, para
lograr aumentar sus ventas realiza
análisis predictivos, donde, además
de la venta, busca brindar ofertas
personalizadas. Lo que ha logrado
una alta satisfacción en la compra,
lo que ha redundado en la lealtad
del cliente, para así ir desplazando
a sus competidores directos.
ASCII DELIMITADO

SISTEMAS DE GESTIÓN DE BASES DE


DATOS RELACIONALES

FORMATOS NO ESTRUCTURADOS

FORMATOS SEMIESTRUCTURADOS

FORMATOS ESTRUCTURADOS
EN ESTA CATEGORÍA SE ENCUENTRAN ALGUNOS COMO: DBASE, DATAEASE, DATAFLEX,
EXCEL,GOLDMINE, LOTUS 1-2-3, QUATTRO PRO, SAS, SPLUS, SPSS, USMARC, AND XDB

FORMATOS MAS COMUNES DE ARCHIVOS DE DATOS:


Bases de
datos
relacionales
▪ Una base de datos relacional, también llamada
Sistema de administración de bases de datos
relacionales (RDBMS) o base de datos SQL,
almacena datos en tablas y filas, también
conocidas como registros. El término "base de
datos relacional“ fue utilizado por primera vez en
1970 por EF Codd en IBM en su artículo de
Bases de datos investigación "Un modelo relacional de datos para
relacionales grandes bancos de datos compartidos".
▪ Brindan capacidades para crear y actualizar
bases de datos relacionales.
▪ Una base de datos relacional es un tipo de
base de datos que almacena y proporciona
acceso a puntos de datos relacionados entre sí.
▪ Las bases de datos relacionales se basan en el
modelo relacional, una forma intuitiva y directa Sistemas de
de representar datos en tablas. gestión de bases
▪ En una base de datos relacional, cada fila en de datos
una tabla es un registro con una ID única,
llamada clave.
relacionales
▪ Las columnas de la tabla contienen los
atributos de los datos y cada registro suele
tener un valor para cada atributo, lo que
simplifica la creación de relaciones entre los
puntos de datos.
Indexación
▪ Las bases de datos relacionales también
brindan una funcionalidad llamada
"indexación". Un índice de base de datos es
una estructura de datos que mejora la
velocidad de recuperación de datos. Los
índices se agregan comúnmente a los
campos de datos que se usan de forma
rutinaria para consultar y unir tablas. En las
declaraciones SQL anteriores, EmployeeId y
CompanyId serían candidatos para este tipo
de optimización.
▪ Trabajan con datos estructurados.
Indexación
▪ Las relaciones en el sistema tienen
restricciones, lo que promueve
un alto nivel de integridad de los datos.
▪ Hay capacidades de indexación ilimitadas, lo
que da como resultado tiempos de
respuesta de consulta más rápidos.
▪ La base de datos no relacional, o base de datos
Bases de datos no relacionales
NoSQL, almacena datos. Sin embargo, a diferencia
de la base de datos relacional, no hay tablas,
filas, claves principales o claves externas.
▪ En su lugar, la base de datos no relacional utiliza
un modelo de almacenamiento optimizado para
requisitos específicos del tipo de datos que se
almacenan.
Base de
Almacén de
datos
datos de
orientada a
documentos
columnas

Tipos de no
Base de
relacionales datos de
Almacén de
clave-valor
gráficos.

Hay cuatro tipos no relacionales populares:


A menudo se utilizan combinaciones de estos tipos para una sola aplicación.
▪ Tienen la capacidad de almacenar
grandes cantidades de datos con poca
estructura.
▪ Proporcionan escalabilidad y flexibilidad
para cumplir con los cambiantes
requisitos comerciales.
Tipos de no
relacionales ▪ Proporcionan opciones sin esquema o de
lectura de esquema.
▪ Tienen la capacidad de capturar todo
tipo de datos "Big Data", incluidos los
datos no estructurados.
▪ Están orientados a documentos.
Proyecto
▪ TRABAJO ESCRITO.
▪ ¿Qué tengo que hacer?
▪ A lo largo de la asignatura se realizará un trabajo escrito
mediante el cual se te solicita una infografía de los aspectos
más relevantes de tu semana 1 y 2.
▪ Esta primera entrega corresponde al 10% de tu calificación
final, la cual incluye información de las semanas 1 y 2. Es
importante que tomes en cuenta esto, debido a que la
siguiente entrega contemplará la semana 3 y 4, por lo que el
porcentaje asignado se modificará al 15%.
¿Dónde y cuándo entregarlo?

Entrega el trabajo en las fechas estipuladas en la plataforma.

Nombre del trabajo escrito: Inteligencia de negocios y


adquisición de datos
Entregable 1 (semana 2) Después de analizar los temas de correspondientes a la semana 1
y 2 de tu asignatura, se te solicita realizar una infografía con los elementos que consideras
más importantes para tu conocimiento.

Instrucciones:

En un documento en Word deberás realizar una infografía


utilizando, cualquier página de su preferencia:
Estructura

Una Infografía debe diseñarse tomando en cuenta los siguientes criterios:

• El titular: Resume la información visual y textual que se presenta en la infografía. Es


directo, breve y expreso. Si se considera conveniente puede acompañarse de una
bajada o subtítulo en el que se indique el tema a tratar, pero es opcional.

• El texto: Proporciona al lector en forma breve toda la explicación necesaria para


comprender lo que la imagen no puede expresar.

• El cuerpo: Contiene la información visual que puede presentarse a través de gráficos,


mapas, cuadros estadísticos, diagramas, imágenes, tablas, etc. También, se considera la
información tipográfica explicativa que se coloca a manera de etiquetas y que pueden
ser números fechas o palabras descriptivas.

Dentro de la información visual siempre hay una imagen central que prevalece por su
ubicación o tamaño sobre las demás y de la cual se desprenden otros gráficos o textos.
Dentro de la información visual siempre hay una imagen central que prevalece por su
ubicación o tamaño sobre las demás y de la cual se desprenden otros gráficos o textos.

• La fuente: Indica de dónde se ha obtenido la información que se presenta en la infografía


y es muy importante, pues señala el origen de la misma.

• El crédito: Señala el nombre del autor o autores de la infografía, tanto del diseño como de
la investigación.

Adicionalmente, la infografía debe ir acompañada de:

• Introducción: breve redacción en un párrafo, acerca de las ideas, conceptos y


conocimientos se poseía respecto del tema antes de realizar la actividad.

• Conclusión: breve redacción en un párrafo, donde se exprese lo que se logró aprender a


raíz de la actividad realizada.
Notas
• Bases de datos no relacionales cuentan con la
capacidad de almacenar grandes cantidades de datos con
poca estructura

• Big Data cuenta con la capacidad de capturar todo tipo


datos.

• Consolidación de datos cuenta con tres pasos clave el


extraer, el transformar y cargar (ETL).

• El Índice de base de datos es la estructura de datos que


mejora la velocidad de recuperación de datos.
• El proceso de canalización de datos de ELT es popular,
porque creen que es más fácil transformar los datos una vez que se
replican en el almacén de datos de destino.

• El proceso de canalización de datos para replicar desde una


fuente a un almacén de datos se conoce como relaciones en el
sistema.

• En una plataforma de integración se datos tal como están


almacenados mediante el archivo de datos.

• ETL es el proceso de canalización de datos para replicar datos


desde la fuente a un almacén de datos.
• Excel es un archivo de datos de formato no
estructurado.
• Formatos estructurados se considera una categoría de
dBASE, DataEase, DataFlex, Excel, Goldmine, Lotus 1-2-3,
Quattro Pro, SAS, SPLUS, SPSS, USMARC, and XDB.
• Indexación refiere a los diversos métodos para incluir
en el índice de internet el contenido de un sitio web.

• La base de datos relacional se conoce también como


base de datos SQL, la cual almacena datos en tablas y filas,
también conocidas como registros.
• Las bases de datos no relacionales tienen la capacidad de
almacenar grandes cantidades de datos con poca se llaman
Indexación.

• Los sistemas de gestión de bases de datos relacionales tienen la


capacidad de crear y actualizar bases de datos relacionales, pero
fue en 1970 se usó la base de datos relacional por EF Codd en IBM.

• NoSQL esta forma a las bases de datos no relacionales.

También podría gustarte