Está en la página 1de 46

INSTITUTO POLITECNICO NACIONAL

Unidad Profesional Interdisciplinaria de Ingeniería y


Ciencias Sociales y Administrativas

Academias de Tecnología Informática


Unidad de Aprendizaje
Tecnologìas del Conocimiento
Introducciòn
Te explicamos la innovación más reciente

1.1 BASE DE
DATOS
Youtube: Base de Datos
Es un conjunto de datos estructurados y defnidos a través de un
proceso específco, que sirven para la descripción de los datos
buscando evitar la redundancia, y que se almacenará en algún
medio de almacenamiento masivo, como un disco.
Reinosa, Maldonado, Muñoz, Damiano, Abrutsky

Es un conjunto de herramientas conceptuales que sirven para la


descripción de los datos, relacionados entre ellos,
¿Que es una Base de semánticamente asociada y restricciones de consistencia.

Datos?
Colección de datos interrelacionados almacenados en conjunto
sin redundancias perjudiciales o innecesarias; su fnalidad es servir
a una aplicación o más, de la mejor manera posible; los datos se
almacenan de modo que resulten independientes de los
programas que los usan; se emplean métodos bien determinados
para incluir nuevos datos y para modifcar o extraer los datos
almacenados.
James Martin en su obra de 1975 Computer Data-base Organization
Niveles de las Bases de
Datos
Nivel externo: lo conforman las múltiples vistas de los datos almacenados
en la base de datos y se presentan a los distintos usuarios de múltiples
formass, adecuándolas a las necesidades de información que tiene cada
uno.
A este nivel también se lo denomina nivel de visión, que se defne con el
lenguaje de manipulación de datos.

• Nivel conceptual: es la estructura lógica global, que representa la


estructura de datos y sus relaciones. Hay una única vista en este nivel y se
la define con el lenguaje de defnición de datos.

•Nivel interno: se defne como el conjunto de datos que están


almacenados físicamente y, como no se accede a ellos, también se lo
denomina nivel físico.
físicamente y, como no se accede a ellos, también se lo denomina nivel físico
Cuando se desea información de algun tipo que está almacenada
en una base de datos no se accede directamente a ellos. Se utilizan
aplicaciones que ya han sido desarrolladas para fnes específcos.
Al conjunto de programas aglutinados es lo que se denomina
“Sistema de Gestión de Bases de Datos (SGBD)”, “Database
Management System” (DBMS) e, incluso, “Motor de Base de Importancia de
Datos”. Es una capa de software que controla todos los accesos a
la base de datos, cabe aclarar, que un DBMS, no se crea para una
Sistema de Gestión
situación específica. de Bases de Datos
El DBMS puede implementar instrucciones dadas por los distintos
usuarios y se agrupan mínimamente en:

DDL (Lenguaje de Definición de Datos) es el conjunto de órdenes


que permiten definir la estructura de una base de datos.
DML (Lenguaje de Manipulación de Datos) las instrucciones que
conforman este grupo son las que están incluidas
en las aplicaciones y se usan para alterar el contenido de un
archivo de datos.
DCL (Lenguaje de Control de Datos) son órdenes que se utilizan
para implementar seguridad en la base de datos.
Usuarios de las
Bases de Datos

Administrador de la base de datos:


Programador de aplicaciones:
comúnmente es el profesional–ingeniero Usuario Final:
conoce los casos que se desarrollarán escritos
o analista— con perfl técnico que, en el es el personal que interactúa con las
e identifcados por el Equipo de Análisis y
ambiente informático, se denomi-
Diseño—, los prototipos de interfaces y las aplicaciones programadas por el
na DBA (Data Base Administrator). Este
estructuras de los almacenamientos que se usuario mencionado en el párrafo
profesional, muy importante para la
manipularán. El programador genera las precedente y es, de entre todos los
empresa, recibe las especifcaciones del
aplicaciones necesarias en el sistema con el usuarios, el que menos
Equipo de Análisis y Diseño para
lenguaje de programación que se le indica y conocimiento técnico posee.
su implementación en un Sistema de
conoce, para la obtención de las
Gestión de Base de Datos, como por
entradas de datos que alimentarán la base de
ejemplo, Oracle, SQL Server, DB2, etcétera.
datos y, también, para lograr
las salidas como las pantallas de resultados o
reportes, que se plantearon en la propuesta de
solución.
Te explicamos la innovación más reciente

1.1.1 ESTRUCTURA Y
TIPOS DE BASE DE
DATOS
Entérate de la forma en que la 5G está cambiando el mundo de la comunicación
ESTRUCTURA DE UNA BASE DE DATOS
La base de datos y la estructura de base de datos se
definen en el proceso de instalación. . Base de datos
que se puede percibir como un conjunto de tablas y se
puede manipular según el modelo relacional de los
datos.
Cada base de datos incluye:
1.- Conjunto de tablas de catálogo de sistema que
describe la estructura lógica y física de los datos.
2.- Archivo de configuración que contiene los valores
de parámetro asignados a la base de datos.
3.-Registro de recuperación con transacciones en
curso y transacciones archivables.
MODELOS LÒGICOS BASADOS EN OBJETOS
Tipos:
Se usan para describir datos en los niveles conceptual y de
visión. Se caracterizan por el hecho de que proporcionan
capacidad de estructuración bastante flexible, permite
especificar restricciones de datos explícitamente y son
independientes de la forma en que los datos se almacenan y
manipulan. Modelo Binario

Se basa en una colección de objetos, cada uno de los cuales


representa un ente abstracto del Sistema de Información para
modelar. Modelo
Semàntico de
El objeto contiene información, atributos,que representan su Datos
estado. Por otra parte, los objetos tienen asociado código,
métodos que opera sobre el objeto.
Modelo
Infològico
TIPOS
Tipos:

Modelo Orientado a
Objetos

Modelo Binario

Modelo
Semàntico de
Datos

Modelo
Infològico
Modelo Orientado a Objetos

El modelo orientado a objetos se basa en una colección de


objetos, cada uno de los cuales representa un ente abstracto del
Sistema de Información para modelar.
El objeto contiene información, atributos, que representan su
estado. Por otra parte, los objetos tienen asociado código,
métodos, que opera sobre el objeto.
Los objetos que tienen los mismos tipos de valores y los mismos
métodos se agrupan en una clase.
Una clase puede ser vista como una definición de tipo para
objetos.
Cada objeto tiene su propia identidad,independientemente de
los valores desus atributos. Así, dos objetos que contienen los
mismos valores para susatributos, son distintos. La distinción
entrelos objetos se mantienen en el nivelfísico por medio de
identificadores de objeto.
MODELO LÒGICO BASADO EN REGISTROS
Se utilizan para describir datos en los niveles
Dentro de los modelos lógicos basados en
conceptual y físico. Los modelos lógicos basados en
registros tenemos los siguientes:
registros se llaman así, porque la Base deDatos
está estructurada en registros deformato fijo de Modelo de red
varios tipos. Cada registro define un número fijo de Modelo jerárquico
campos, o atributos, y cada campo normalmente es Modelo relacional
de longitud fija. Esto contrasta con los modelos
orientados a objetos en los que los objetos pueden
estar compuestos por objetos a un nivelde
anidamiento de profundidad arbitraria.Los modelos
lógicos basados en registros, no incluyen un
mecanismo para la representación directa de
código en laBase de Datos.
TIPOS
Tipos:

Modelo de Red

Modelo
Jeràrquico

Modelo
Relacional
Modelo de Red

En este modelo, los datos se representan como una colección de


registros la relación entre ellos se da por medio de apuntadores.
Los registros organizan como una colección de graficas
arbitrarias.

Ventajas:Acceso rápido a los datos debido a los apuntadores.

Desventajas: Los apuntadores o direcciones sedeben almacenar


junto con los datos.
Para recuperar información
se debe navegar a través de la
grafica.
Modelo de Jerarquico

En este modelo, los datos e representan como una


colección de registrosmientras que la relación entre
ellos seda por medio de ligas o
apuntadores.Rediferencia del modelo de red, en
que los registros están organizados
comocolecciones de árboles en vezde graficas
arbitrarias.

Ventajas: Acceso rápido a los datos debido a los


apuntadores.
Desventajas:No puede haber ciclos y sólo puede
hacer asociaciones.
Los apuntadores o direcciones sedeben almacenar
junto con los datos.
Modelo Relacional

En el modelo relacional, los datos y las relaciones entre


los datos serepresentan por medio de una serie de
tablas, cada una de las cuales estacompuesta por
columnas con nombres únicos. Una columna de una
tabla representa una relación entre un conjunto de
valores. Existe unacorrespondencia entre el concepto
de tabla y el concepto matemático de relación, del cual
recibe su nombre el modelo relacional.

Ventajas: Tiene una base matemática, conocida como


Álgebra y CalculoRelacional.
Se puede representar fácilmente asociaciones.
Te explicamos la innovación más reciente

1.1.2 MODELO DE
DATOS RELACIONAL
Entérate de la forma en que la 5G está cambiando el mundo de la comunicación
Introducciòn
El modelo relacional logró la adhesión
El modelo de datos relacional perteneciente inicial de otros expertos, porque
al grupo de modelos de datos apuntaba a resolver el problema de
orientados a registros es hoy el modelo de grandes bases de datos compartidas
mayor uso y difusión en los distintos
tipos de organizaciones, aunque con
importantes cambios y adecuaciones
realizados a través del tiempo.

Edgar “Ted” Frank Codd. (23 de


agosto de 1923 - 18 de abril de 2003).
Científco informático inglés conocido
por sus aportes a la teoría de bases
de datos relacionales. Enlace:
Conceptos propios del modelo:
Concepto -Relaciòn:es más que una representación en dos
dimensiones, o de doble
entrada, constituida por flas, o tuplas y columnas
Son los datos que se representan
o atributos.
de una sola manera, en el nivel de
-Fila o tupla: es un hecho en la relación que
abstracción que es visible al contiene datos de la realidad.
usuario, y específicamente como -Cuerpo: al conjunto de tuplas de una relación se
una estructura tabular conformada lo denomina cuerpo de la
por flas y columnas como una tabla relación.
con valores. -Columna o atributo: es una propiedad que
caracteriza a cada entidad.
-Dato: es la mínima unidad que se almacena en
una relación.
-Grado: se llama así al número de columnas que
conforman la relación.
-Cardinalidad: así se denomina al número de
tuplas o flas de una relación.
Dominio: es el conjunto de valores posibles de un
atributo en la relación.
Llaves

Llaves Primarias
Las llaves permiten identificar una entidad o un grupo. La llave está constituida por atributos (puede ser
1 o un grupo), son campos de relevancia en la asociación de entidades. Una entidad fuerte posee una
llave primaria. Una llave primaria nos permite identificar una entidad y la llave secundaria nos permite
identificar un grupo de entidades.

Llaves Foráneas
Corresponden a un atributo de una tabla relacionada, que es llave primaria en una tabla principal, es
decir, es el atributo de una entidad, que es clave primaria de otra.
Modelo Entidad Relaciòn
Un conjunto de asociaciones, es un grupo de relaciones del mismo tipo. Formalmente es una
relación matemática de N mayor o igual que 2 (posiblemente idénticos) conjuntos de entidades.
Elementos Bàsicos del Modelo
Entidad Relaciòn
Los principales elementos del
modelo entidad-relación son
las entidades con sus
atributos y las relaciones
entre entidades. Se trata de
un objeto del que se recoge
información de interés de
cara a la base de datos.
Gráficamente se representan
mediante un rectángulo.
El modelo entidad-relación está formado por un conjunto de conceptos que
permiten describir la realidad, mediante un conjunto de representaciones gráficas y
lingüísticas.
Diagrama de Flujo de Datos

Es una representación gráfica del flujo de datos a


través de un sistema de información. Un diagrama de
flujo de datos también se puede utilizar para la
visualización de procesamiento de datos (diseño
estructurado). Es una práctica común para un
diseñador dibujar un contexto a nivel de DFD que
primero muestra la interacción entre el sistema y las
entidades externas.
Operaciones en el Modelo Relacional:
Las operaciones que se pueden llevar a cabo en el modelo relacional tiene un
fundamento matemático conocido como Álgebra Relacional. Consta de un conjunto
de operaciones que toman como entrada una o dos relaciones. Las operaciones
definidas en el Álgebra Relacional tiene la propiedad de cerradura, ya que el
resultado de la operación es una relación.

Existen cinco operaciones:


•Proyección
•Elecciónσ
Producto Cartesiano X
•Unión U
•Resta de conjuntos–•
Intersección de Conjuntos∩
Para mas información: Modelo Relacional
Se puede definir una base de datos relacional como una base de datos que el
usuario percibe como un conjunto de relaciones normalizadas. El término base
de datos relacional significa una base de datos para la cual los operadores a
disposición del usuario – consultas e informes- operan sobre estructuras
relaciónales. No significa por fuerza que los datos estén almacenados en forma
de tablas físicas.

En resumen, puede decirse que, en términos tradicionales en una oficina, una


relación se asemeja a un archivo, un caso a un registro y un atributo a un campo.
Dicho de otra manera, las relaciones pueden considerarse archivos "altamente
disciplinados". Esta disciplina se traduce en una simplificación considerable de
las estructuras de datos que el usuario debe manejar, y, por tanto, en una
simplificación correspondiente de los operadores necesarios para manipularlas.

Resumen youtube : Modelo relacional


SQL

El Lenguaje de Consulta Estructurado popularmente conocido por sus siglas


en inglés como SQL, es un tipo de lenguaje de programación que ayuda a
solucionar problemas específicos o relacionados con la definición,
manipulación e integridad de la información representada por los datos que
se almacenan en las bases de datos.

Algunos aspectos de SQL están basados en el cálculo relacional, algunos en


el álgebra relacional que provienen del modelo relacional y otros a ninguno
de los dos sino que son parte de SQL.

Para el almacenamiento y operaciones de manipulación de los datos, el


modelo relacional establece el uso de relación y variable de relación;
mientras tanto SQL hace uso de las tablas como elemento fundamental.
LMD Lenguaje de Manipulación de Datos
LDD Lenguaje de Descripción de Datos
Es un lenguaje relacional mas usado por los proveedores de DBMS LCD Lenguaje de Control de Dato
Existen en el mercado variantes del lenguaje SQL.
El SQL estándar de ANSI, es por lo general, un subconjunto del SQL que
implanta cada proveedor
Te explicamos la innovación más reciente

1.1.3 BASES DE DATOS


MULTIDIMENSIONALES Y
TECNOLOGÌA (OLAP)
Entérate de la forma en que la 5G está cambiando el mundo de la comunicación
En el desarrollo de software sobre bases de datos OLAP (On-line
Analytical Processing) se refiere a la sintesis, analisis y consolidacion de
grandes volumenes de datos multidimensionales.
Tecnologìa Es una soluciòn utilizada en el campo BI (Business Intelligence), para lo cual
OLAP utiliza cubos de infromaciòn y puede ser utilizado en Data Mining (Minerìa de
Datos).
Los DBMS (DataBase Management System) relacionales se han desarrollado
para permitir la ejecuciòn eficiente de una gran nùmero de transacciones
relativamente simples, para consultas màs avanzadas se requiere OLAP.

https://youtu.
be/2ryG3Jy6eI
Y
Caracterìsticas

OLAP ofrece algunas opciones para el modelado analítico, que incluyen


un motor de cálculo para la obtención de proporciones, desviaciones
respecto a la media, etcétera, que abarcan las mediciones de datos
numéricos realizadas a través de muchas medicione

La rapidez de respuesta del modelo OLAP a las consultas permite que el


proceso de análisis no se interrumpa y, por lo tanto, que la información no
pierda vigencia.
Esto se debe al modelado de datos dimensional que se realiza durante el
armado del modelo, en el que se efectúan los cálculos previos para la
integración de infor-mación que lo simplifcan.
Además, cuenta con un motor de depósito de datos multidimensional con
capacidad para almacenar los datos en arreglos.
Las organizaciones para garantizar su subsistencia necesitan ciertos parámetros de
eficiencia que les permitan, la maximización de su inversión
y su subsistencia en el tiempo mediante una correcta planifcación
de su futuro. Es por ello que se necesita del procesamiento analítico de las situaciones
pasadas que faciliten la planifcación de su futuro (On-line Analytical Processing u OLAP).

El modelo OLAP utiliza


un sistema unificado de análisis que
resume, integra y, también, distribuye
la información por las diferentes áreas
de una organización
Concepto
En las bases de datos multidimensionales, la
información se almacena en forma dimensional y
no relacional. Las dimensiones determinan la
estructura de la información almacenada y
defnen caminos de consolidación.
La información que se reúne se muestra como
variables que, a la vez, se determinan por una o
más dimensiones. De esta manera, y a partir de
la intersección de esas dimensiones, se almacena
el valor.

El cubo multidimensional posee tres dimensiones: tiempo, productos y regiones. La información de una
variable se puede analizar dentro del cubo que se forma en la intersección de sus dimensiones.
Vistas Multidimensionales
La fgura A representa la división del cubo en un plano
vertical. En este caso, un gerente de área puede medir el
desempeño de la región que le corresponde.

La figura B, por ejemplo, sería muy útil para un gerente de


producto puesto que podría analizar en el plano horizontal el
desempeño del bien o servicio que ofrece.

En la figura C, se comparan dos años diferentes. Esta


visión temporal permite medir, por ejemplo, las ventas de
dos períodos consecutivos.

En la fIgura D, se observa lo ocurrido en un periodo de


tiempo, una región y un producto determinado, el
comportamiento del mismo.
Tecnicas de Almacenamiento

HIPERCUBOS MULTICUBOS
Se utiliza de forma espe- La estructura de los multicubos divide
cífca para la identifcación de el universo en diferentes cubos de MIXTO
estructuras con más de tres menor tamaño e intenta dinamizarla
dimensiones. mediante punteros. Así, disminuye Permiten que el almacenamiento físico
el espacio de almacenamiento y de los datos se realice como si se tratara
la posibilidad de dispersión. Esta de un multicubo, pero los cálculos se
situación permite que los cubos no ejecutan como si se estuviera
deban replicar el tamaño de una de trabajando con un hipercubo. De esta
manera, combinan la simplicidad del
las dimensiones a las restantes.
hipercubo con la fexibilidad del
multicubo.
Te explicamos la innovación más reciente

1.1.4 INTEGRACIÒN ENTRE


BASES DE DATOS Y
HERRAMIENTAS (OLAP)
Entérate de la forma en que la 5G está cambiando el mundo de la comunicación
Las bases de datos multidimensionales suelen adquirir datos de otras fuentes como bases de datos
relacionales, herramientas de escritorio u hojas de cálculo; también los usuarios fInales pueden introducir
algunos datos.

En un ROLAP (Relational OLAP), los datos se almacenan físicamente en un RDBMS, mientras que en un MOLAP
(Multidimentional OLAP) están en un MDB en el que se almacenan en diferentes estructuras que se optimizan por un
procesamiento multidimensional. Por último, existen los modelos HOLAP (Hybrid OLAP), en los que se mezclan la
arquitectura de bases de datos multidimensionales y de datos relacionales.

las aplicaciones OLAP se orientan hacia el uso interactivo para que el


usuario obtenga una rápida respuesta a sus interrogantes (en tiempos muy cortos).

Para obtener una rápida respuesta, las aplicaciones multidimensionales necesitan precalcular algunos de los datos
que se utilizarán en el análisis.
Para que no se produzca una explosión de datos se pueden utilizar dos principios: en primer lugar, se
debe evitar cualquier objeto multidimensional con más de cinco dimensiones, ya que esto provocará la
multiplicación de datos dispersos.
En segundo lugar, se puede reducir la dispersión de objetos de datos individuales a tra-vés de un buen
diseño y gracias a la utilización de una aproximación de multicubos en la que cada objeto posea solo la
mínima cantidad de dimensiones necesaria. Para calcular la cantidad exacta de lo que se debe precalcular
dependemos de los siguientes factores: el hardware, la topología y el tamaño de la red, las caracte-rísticas
del software, el número de usuarios, la complejidad de los cálculos, etcétera.
OLAP multidimensional (MOLAP)

El diseño lógico o el modelo de información son los que conducen el


diseño inicial y la actividad de confguración.
Solo pueden almacenarse y analizarse de manera eficiente una
cantidad limitada de datos.
La navegaciòn y el analisis de los datos estan limitados, porque los
datos se diseñan de acuerdo a requisitos previamente determinados.
Los productos MOLAP requieren un conjunto diferente de
capacidades y herramientas para construir y mantener la base de
datos, incrementandose el costo y la complejidad de las tareas de
soporte.
OLAP Relacional (ROLAP)

Soportan los productos RDBMS mediante el uso de un


nivel de metadatos, evitando asi la necesidad de crear una
estructura de datos multidimensional estàtica. Esto
facilita la creaciòn de mùltiples vistas multidimensionales
de la relaciòn bidimensional.
Para mejorar las prestaciones, algunos productos ROLAP
disponen de motores SQL mejorados para soportar la
complejidad del anàlisis multidimensional.
OLAP Hìbrido (HOLAP)

Proporcionan capacidades limitadas de anàlisis, bien


sobre productos SGBDR o bien utilizando un servidor
MOLAP intermedio.
Las herramientas HOLAP suministran a la màquina de
escritorio los datos seleccionados en la forma de un cubo
de datos, el cual se almacena, analiza y mantiene
localmente.

También podría gustarte