Está en la página 1de 14

Studienbrief 01 - Datenmanagement

1. Erläutern Sie die Pyramide von Zeichen zum Wissen


Wissen  Information  Daten  Zeichen
Kontext  Interpretation  Repräsentiert
Ableitung Darstellung  Zusammensetzung
2. Definieren Sie Information
Sachhaltige Bedeutung einer Nachricht zwischen Sender und Empfänger
3. Welche Klassifikation von Informationen gibt es?
Interne Informationen: Entstehen im Unternehmen für das Unternehmen. Werden auch dort verarbeitet.
Externe Informationen: Entstehen außerhalb des Unternehmens und werden auch dort verarbeitet. Quellen
erschließen und im Unternehmen richtig einsetzen.
Metainformationen: Informationen über Informationen
4. Definition von Management
Aufgaben der Leitung eines Unternehmens. Definition von Zielen, Planerstellung für Ziele,
Grundsatzentscheidung über auszuführende Pläne, Erteilung von Anweisungen zur Umsetzung
beschlossener Pläne, Kontrolle der Realisierung. Es handelt sich dabei um einen Kreislauf.
5. Definition von Informationssystemen
Informations- und Kommunikationssysteme. Nicht nur Software-Systeme. Information ohne Kommunikation
ist unmöglich.
Offen: interagieren mit Umwelt, dynamisch: verändern Eigenschaften innerhalb eines Zeitraumes, komplex:
viele Elemente und viele Beziehungen.
Häufig in Subsysteme zerlegt. Betrieblich – überbetriebliche IS, branchenspezifisch – branchenübergreifend
IS sind sozitechnische Systeme, die menschliche und technische Komponenten beinhalten. Zur optimalen
Bereitstellung von Information und Kommunikation nach wirtschaftlichen Kriterien.
6. Definition Informations- und Kommunikationstechnik
Aufgrund der Grundfunktion Speichern, Verarbeitung und Kommunikation.
Informations- und Kommunikationstechnik sind alle zur Verfügung stehenden Ressourcen für
Grundfunktionen und deren Organisation.
7. Was ist bei Architektur von Informationssystemen essentiell?
Ganzheitlichen Überblick behalten. Architekturen, die strukturelle Sicht und Modellierung verbinden.
Architekturen: Framework for enterprise architecture, Modell ganzheitlicher Informationsarchitektur, …
8. Erläutern Sie das Modell ganzheitlicher Informationsarchitektur.
Notwendigkeit, dass alle Schichten abgestimmt sind. Hier handelt es sich um ein Kreisel (Balance).
Strategie /
Prozess – Ablauforganisations – Architektur /
Anwendung – Daten – Kommuniaktion Architektur /
Infrastruktur
9. Erläutern Sie ARIS nach Scheer
Gestaltung eines einzelnen Informationssystems.
Architektur integrierter Informationssysteme (2-
dimensionale Betrachtung). Sichten vs.
Entwicklungsstufen
Sichten: Daten, Funktionen, Steuerung,
Organisation) in Ebenen strukturiert

10. Definieren Sie Informationsmanagement


Managementaufgaben zur Verarbeitung und Beschaffung von Informationen in sozioökonomischen
Systemen. Ausrichtung aller Be- und Verarbeitungen von Informationen auf Unternehmensziele und
Organisation.
11. Definition Informationsmanagement nach Krmer / Kahmenmodell
Informationsmanagement ist Management und inkludiert:
Informationswirtschaft: Angebot und Nachfrage von Informationen
Informationssysteme: Daten, Prozesse, Anwendungssysteme
IuK Technologie: Speicherung, Verarbeitung, Kommunikation
Übergreifende Führungsaufgaben: IM-Bedeutung, IM-Aufbauorganisation, IM-Personal, IM-Controlling (IT
Governance, Strategie, IT-Prozess, …)
Ziel: bestmöglicher Einsatz der Ressource Information. IM ist Management und Technikdisziplin. Elementarer
Bestandteil der Unternehmensführung.
12. Definieren Sie Betrachtungsobjekte im Informationsmanagement
Objekte, um die sich das Informationsmanagement dreht. Information, Informationssysteme, Informations-
und Kommunikationstechnologien
13. Definieren Sie Querschnittsobjekte im Informationsmanagement
Personal, Qualität, Katastrophenschutz, Sicherheit und Datenschutz
14. Nennen Sie Aufgaben des Informationsmanagements
Strategisch: Planung der Strategie, Informationsarchitektur und – infrastruktur, Technologiemanagement,
Sicherheitsrichtlinien, Controlling
Administrativ: Management von Projekt, Personal, Daten, Wissen, Sicherheit, Katastrophen.
Geschäftsprozessunterstützung
Operativ: Laufender Betrieb, Problemmanagement, User-Unterstützung
15. Was ist das Jahrhundertproblem der Informatik in Datenmanagement
Bewältigung des Datenchaos aufgrund schnellen Wachstums. Schaffung einer Datenbasis.
16. Definieren Sie Datenmanagement
Aufgaben des Managements im Informationsmanagement (Planen-Führen-Kontrollieren) hinsichtlich Daten
und deren Speicherform inkl. Datensicherheit und Datenschutz.
17. Was sind die Anforderungen an Datenmanagement?
Richtige (Daten, Zeit, Ort) verfügbar. Darüber hinaus richtige Daten wirtschaftlich und sicher erfassen,
speichern und verwalten.
18. Was sind die Aufgaben des Datenmanagements?
Betriebliche und technische Funktionen: Daten (-modellierung, -administration, -technik, -sicherheit,
-konsistenz), Sicherung, datenbezogene Benutzerservice)
Optimale Datennutzung im Unternehmen: Richtigkeit, Konsistenz, Aktualität, Aufgabenbezogenheit,
Zusammenhang von Daten, Verbesserung der Informationsqualität, produktive Anwendungsentwicklung (DB
und Modellierungstechnik)
19. Definieren Sie die Strategie von Datenmanagement
Festlegung von Daten je Aufgabe, Festlegung von jeweiligen Verantwortlichen, Bereitstellung.
Datenmanagement setzt auf Datenarchitektur auf. Erfasst betriebliche Daten (Form, Inhalt, Verarbeitung,
Verfügbarmachung).
Explizit: Datenanalyse, Datenschutz, externe Datenbeschaffung
20. Warum ist Datenmanagement wichtig?
Daten: zur Aufgabenerledigung, haben in IS längste Lebensdauer, ändern sich in IS am schnellsten, sind
Erfolgsfaktoren, Volumen nimmt ständig zu, aus unterschiedlichen Quellen, in unterschiedlichen Formaten
21. Erläutern Sie die Vorgehensweise zum Entwurf von Informationssystemen
Funktions- / ablauforientiert: Anfangs zu realisierenden Funktionen betrachtet. Erst dann Daten und –
strukturen zu Funktionen zugeordnet. Nachteil: Nicht eindeutig, Redundanzen
Datenorientiert: Datenbetrachtung am Anfang. Datenanalyse unabhängig von Funktion. Gemeinsame
Datenbasis. Vermeidet Redundanzen, größere Stabilität
22. Erläutern Sie das Schichtmodell der Modellierung für Daten
Ähnlich OSI
Reale Welt tatsächliche Instanzen der Objekte
Beschreibung realer Welt normale Sprache benannt und beschrieben
Modell der realen Welt eher Zusammenfassung nach synt. Regeln
Konzeptionelles Datenmodell Entitäten und Relationen. DB gestaltbar
Logisches Datenbankmodell Datenmodell durch Datenfelder, Verweise, Abhängigkeiten
Gespeicherte Informationen Gespeicherte Bits und Bytes
Speichermedium Festplatte, wo Informationen gespeichert sind.
23. Worauf sollte beim Unternehmensweiten Datenmodell geachtet werden?
Gewähltes Verfahren soll Modellierungstechnik entsprechen. Verfahren ERM (Aufbau rel. Datenmodelle) und
UML (Objektorientierte Modellierung. Grad der Normalisierung. Unternehmensmodell zur Betrachtung (inkl.
Unternehmensfunktionsmodell und Unternehmensdatenmodell)
24. Erläutern Sie die ABC-Klassifizierung
A, B, C, IT-Ebenen
A Unternehmensdatenmodell, Unternehmensprozess
B Betriebliches Datenmodell, betriebliche Funktionen
C Anwendungsdatenmodell, Systemfunktionen
DV Daten, Programme
25. Wozu ist Datenanalyse notwendig?
Riesige Datenmengen speicherbar. Aber bei Verarbeitung und Auswertung ist wichtig, dass Datenmaterial
richtig vorhanden ist.
26. Nenne Sie Vorgehensmodelle zur Datenanalyse
Problemanalyse
Zieldefinition was analysieren? Welche Fragen
Umsetzungsplan Datengewinnung, Qualitätskontrolle, stat. Methoden SW, Berichtswesen
Projektumsetzung Umsetzung des Plans
Auswertung / Evaluierung Datenanalyse  Kennzahlen  Grafische Ausarbeitung
Umsetzung Dokumentation  aus Kennzahlen  Umsetzung der Erkenntnisse  u. Publikation
27. Nennen und erläutern Sie Ausprägungen der Datenqualität
Datenrichtigkeit richtige Daten
Datenvollständigkeit: Vollständigkeit ohne Lücken, aber keine unnötigen Daten  Datenanalyse
Datenaktualität: Ändern sich Informationen, so auch die Daten
Aufgabenadequanz: Beschreibt, wie vom System abgebildete Daten den Anforderungen
entsprechen. Wenn sie auch benötigt werden.
Datenkonsistenz: Daten mehrfach erfasst, … wenn keine Widersprüche vorhanden.
Absolute Qualität ist nicht möglich. Qualität jedoch vorher zu bestimmen.
28. Nennen Sie Teilaufgaben des strategischen Datenmanagements
Entwicklung Unternehmensdatenmodell von globaler Datenarchitektur
Auswahl Datenbanktechnologie und Datenbankarchitektur
Auswahl Datenbank-Managementsystem (ist mit DB nicht immer gekoppelt)
Entwurf Metadatenbank (Verzeichnis aller Datenbanken, Dateien, Datensätze, Datenelemente. Leider selten.
Datenschutz und Datensicherheit
29. Nennen sie Aufgaben des operativen Datenmanagements
Betrieb gewählter DB-Systeme (Überwachung, Konfiguration, Server, etc.)
Konsistenzprüfung inhaltlich, technisch
Zutrittsberechtigungen User/Passwort zum Schutz von Daten
Datensicherung
Datenbank Recherchen spezielle Anfragen (nur durch wenige Mitarbeiter, mit SQL)
Sicherheitsverwaltung Sicherheitsmaßnahmen
30. Nennen Sie Anforderungen an das Datenmanagement
Anforderungen an
Verarbeitung: Kurze Zugriffs- und Übertragungszeiten. Auswertungen, Verknüpfungen
Speicherung: minimale Redundanz. Innerer Aufbau des Datenbestandes überschaubar
Organisatorisch: Integration und logische Zentralisierung der Datenspeicher
Trennung Datenorganisation und Anwendung (Datenunabhängigkeit)
Datenintegrität (Datenkonsistenz, Datensicherheit, Datenschutz)
Betriebswirtschaftliche Anford.: Wirtschaftlichkeit, Permanenz und Flexibilität
31. Wie können Datenbanksysteme klassifiziert werden?
1. Art der Speicherung Referenz, Volltext, Image, CD-ROM-DB
2. Architektur Datenmodell Relational, Objektrelational, Objektorieniert, Multidimensional
3. Struktur, Lokalisierung, Verteil. Datenhaltung durch DBMS: Zentral, Mehrrechner, Heterogen, Mobil, …
4. Weitere Klassifikationen PC-DB, Desktop, Web, Echtzeit, Open Source, …
Studienbrief 02 – Objektorientiert
1. Probleme mit dem relationalen Datenmodell
1.1 Mengenattribute
Schwäche von relationalen Modellen – keine einfache Möglichkeit Attribute zu definieren
Person (SSN: String, Name: String, PhoneN: {String], Child {SSN}
das SSN bei Child könnte ein Verweis auf eine andere, in der Tabelle bestehende, Person
sein
in { } angegebene Werte stellen Mengenwerte dar, könnte so z.B. aussehen
( 111­22­3333, „Emin S“, {123­456­789, 987­123­456}, {000­11­2222, 333­44­
5555} )
von imMENSEm Vorteil wäre es das Attribut Child als Menge von Verweisen auf andere
Personen
darzustellen
Person (SSN: String, Name: String, PhoneN: {String}, Child {Person} )
hier würde das Child Attribut wiederrum ein Personenobjekt darstellen, somit wären
Abfragen der
Form
SELECT P.Child.Child.PhoneN
FROM Person P
WHERE P.Name = ‘Emin S‘
P.Child.Child.PhoneN ist ein Pfadausdruck
2. Konzeptionelles Objekt Datenmodell
2.1 Objekt ID
jedes Objekt besitzt eine eindeutige unveränderliche Objekt ID, diese wird vom System beim
Erzeugen eines Objektes generiert und zugewiesen <-> Schlüssel im relationalen Modell
(vom
Benutzer erzeugt, können sich ändern, nicht unbedingt systemweit eindeutig)
2.2 Objekte und Werte
Ein Objekt ist immer ein Paar der Form (oid, val)
oid = Objekt ID; val = Wert [Primitive(Int, Str, Float), Referenz, Tuple(A1:v1, An:vn),
Set{v1,…vn}
Referenz, Tuple, Set = komplexe Datentypen
2.3 Klassen
semantisch gleichartige Objekte werden zu Klassen zusammengefasst (z.B. alle Objekte die
Personen
darstellen Klasse PERSON)
Klasse besteht aus: Typ, Signaturen der Methode, Extent (Menge aller Objekte in der Klasse)
Klassen sind hierarchisch, IS A-Beziehung
2.4 Typen (same shit wie bei 2.2)
2.4.1 Subtyping
manche Typen können von anderen Typen abgeleitet werden und in der Struktur
angereichert
werden – d.h. ein abgeleiteter Typ hat die gleiche Struktur wie der ursprüngliche, jedoch
enthält er
zusätzliche Strukturelemente
STUDENT_T ist ein Subtyp von PERSON_T
PERSON_T: [SSN: String, Name: String, Adress: [StNum: Integer, StName:
String]]
STUDENT_T: [SSN: String, Name: String, Adress: [StNum: Integer, StName:
String, Rm: Integer], Majors: {String}, Enrolled: {Course}]
STUDENT_T enthält die Struktur von PERSON_T und erweitert diese im Attribut Adress
(Tuple) und
um einen neuen komplexen Typ Majors
2.4.2 Datenbankschema und Instanz
Datenbankschema beinhaltet die Spezifikation für alle Klassen (Typ der Klasse, Methoden
Signaturen, Klassenhierarchie, Integritätsbedingungen)
Eine Instanz einer Datenbank ist die Menge aller Objekte zu Klassen, die in einem Schema
definiert
sind
3. Objektrelationale Datenbanken
Eine Objektrelationale DB besteht aus einer Menge von Top-Level Klassen mit Tuple
Objekten, diese
haben die Form (oid, value).
3.1 Row-Typen
sind gleich zu sehen wie Tuples. In ORDBs kann ein Row Typ auch als Typ eines einzelnen
Attributes
eines Tuples auftreten
CREATE TABLE PERSON ( Name CHAR(20), Adress ROW(Number Integer, Street
CHAR(20), ZIP CHAR(5)))
3.1.1 Abfrage
Pfadausdrücke…
SELECT P.Name FROM PERSON P WHERE P.Adress.ZIP = ‘12345‘
3.1.2 Insert/Updates
mittels Row Typ Konstruktor
INSERT INTO PERSON(Name, Adress) VALUES (‘Emin S‘, ROW(666, ‘Hollow Rd.‘,
‘66666‘))
UPDATE PERSON SET Adress.ZIP = ‘55555 ‘ WHERE Adress.ZIP = ‘66666 ‘
UPDATE PERSON SET Adress = ROW(21, ‘Main St‘,‘12345‘) WHERE Adress = ROW(123,
‘Maple Dr.‘, ‘54321‘) AND Name=‘Emin S‘
3.2 Benutzerdefinierte Typen
können aus beliebigen Typen zusammengesetzt werden und können als Typ von Attributen
in Tuples
auftreten
Definition eines Typs:
CREATE TYPE PersonType AS (Name CHAR(20), Adress ROW(Number Integer, Street
CHAR(20), ZIP CHAR(5)))
Definition eines Typs unter Verwendung von Vererbung und Methodendeklaration:
CREATE TYPE StudentType UNDER PersonType AS (Id Integer, Status CHAR(2))
METHOD award_degree() RETURNS BOOLEAN
CREATE METHOD award_degree() FOR StudentType LANGUAGE C EXTERNAL NAME
‘file:/home/award_degree‘
Benutzerdefinierte Typen können in 2 Situationen eingesetzt werden
Spezifikation des Domains eines Attributes in
einer Tabelle
Spezifikation des Typs einer gesamten Tabelle
CREATE TABLE TRANSCRIPT (Student
StudentType, CrsCode CHAR(6),
Semester CHAR(6), Grade CHAR(1))
CREATE TABLE STUDENT OF StudentType
Zeilen werden als Objekte betrachtet, Attribut ist
zwar vom gleichen Typ aber kein Objekt
3.3 Objekte
CREATE TABLE STUDENT OF StudentType vs.
CREATE TABLE STUDENT1 (Name CHAR(20), Adress ROW(Number INTEGER, Street
CHAR(20)))
beide sind von der gleichen Struktur aber nur Tuples in STUDENT bekommen eine oid und
sind damit
Objekte!
3.4 Abfragen auf Benutzerdefinierte Typen
keine große Herausforderung – wer’s glaubt…
SELECT T.Student.Name, T.Grade FROM TRANSCRIPT T WHERE
T.Student.Adress.Street = ‘Main St‘
Attribut Name ist nicht ein Element des StudentType sondern wird von PersonType geerbt
3.5 INSERT/UPDATE Benutzerdefinierte Typen
INSERT INTO TRANSCRIPT(Student, Course, Semester, Grade) VALUES(NEW
StudentType().Id(111111111).Status(‘G5‘).Name(‘Emin S‘).Adress(ROW(123, ‘Main
St. ‘,‘54321‘)),‘CS532‘ ,‘S2002‘ ,‘A‘)
bzw. ein Update
UPDATE TRANSCRIPT SET Student = Student.Adress(ROW(21, ‘Maple St. ‘,
‘12345‘)).Name(‘Emin S‘), Grade = ‘B‘ WHERE Student.Id = 111111111 AND CrsCode
= ‘CS532‘ AND Semester = ‘S2002‘
3.6 Referenzen
ideal wäre es eine Tabelle mit Studentenobjekten zu haben, auf diese kann dann einfach
referenziert
werden
CREATE TABLE STUDENT2 OF StudentType REF IS stud_oid
Tabelle mit Referenz
CREATE TABLE TRANSCRIPT1 (Student REF(StudentType) SCOPE STUDENT2, CrsCode
CHAR(6), Semester CHAR(6), Grade CHAR(1))
hier wird das Attribut Student als Referenz auf ein Objekt des Typs StudentType definiert.
SCOPE schränkt die Referenzen auf die Objekte ein welche in der Tabelle STUDENT2
definiert sind
Um Referenzen in einer Query zu verfolgen wird statt des „.“Operators der „ “ Operator
verwendet
SELECT T.Student Name, T.Grade FROM TRANSCRIPT1 T WHERE
T.Student Adress.Street = ‘Main St.‘
Einfügen eines Tuples mit einer Referenz durch Verwendung eines Selects und der Self-
Referencing-
Spalte
INSERT INTO TRANSCRIPT1 (Student, Course, Semester, Grade) SELECT
S.stud_oid, ‘HIS666‘,‘F1462‘,‘D‘ FROM STUDENT2 S WHERE S.Id = ‘111111111‘
3.7 Vererbung
Tabelle STUDENT vom Typ StudentType und Tabelle PERSON vom Typ PersonType
CREATE TABLE PERSON OF PersonType
CREATE TABLE STUDENT OF StudentType
wird ein Datensatz in STUDENT eingetragen ist er NICHT in PERSON, wäre nur der Fall wenn
STUDENT
explizit von PERSON „abgeleitet“ wäre
CREATE TABLE STUDENT OF StudentType UNDER PERSON
PERSON is Supertable von STUDENT und alle Tuples, die in STUDENT eingefügt werden sind
automatisch in PERSON sichtbar
3.8 Collections
Mengentypen = Collections
MULTISET = wie eine Menge, jedoch kann ein Element mehrfach vorkommen
CREATE TYPE CourseType (CrsCode CHAR; Name CHAR; Description CHAR)
CREATE TABLE COURSE OF CourseType
CREATE TYPE StudentType UNDER PersonType AS (Id INTEGER, Status CHAR(2),
Enrolled REF(CourseType) MULTISET)
und wie löst man ein MULTISET auf? Multiset-Attribut in eine einspaltige Tabelle umwandeln
(UNNEST)
SELECT S.Id, S.Adress, C.Name FROM STUDENT S, COURSE C WHERE C.CrsCode IN
(SELECT E  CrsCode FROM UNNEST(S.Enrolled) E)
und versteht das ein Schwein? NEIN!
mit MULTISET kann auch der umgekehrte Weg
gegangen werden
CREATE TABLE TRANSCRIPT2 (Student
REF(StudentType), Course
REF(CourseType), CrsCode CHAR(6),
Semester CHAR(6), Grade CHAR(1))
INSERT INTO STUDENT (Id, Status, Enrolled) VALUES (123456789, ‘H2‘, MULTISET
(SELECT T.Course FROM TRANSCRIPT2 T WHERE T Id=4711)
4. Der ODMG Standard
beschreibt ein Datenmodell, eine Definitionssprache, eine Abfragesprache, einen
Transaktionsmechanismus, Programmiersprachenbindungen
4.1 Strukturen
Hauptidee: Programmiersprache gleich Datensprache
- Objekte der Programmiersprache können direkt auf Datenbankobjekte abgebildet werden
- einige Objekte der Applikation werden als persistent deklariert – Funktion von Proxies im
Bezug zu
den aktuellen DB-Objekten, Änderungen beeinflussen direkt das zugehörige
Datenbankobjekt
- Zugriff auf Objekt über OID bringt es direkt aus der DB in den Speicher und die Applikation
arbeitet
direkt damit als ob es in der Programmiersprache definiert wurde
4.2 ODL – Object Definition Language
ganz selten genutzt
in ODMG DB wird die Struktur der Hostsprache definiert, verursacht aber Problem, dass man
Konstrukte unterschiedlicher Programmiersprachen interoperabel machen muss
Referenzdatenmodell wird benötigt (da sind alle unterschiedlichen
Programmiersprachenkonstrukte
abgebildet)
4.3 ODMG Datenmodell
definiert Klassen, Hierarchien und Typen, zwei Typen von Klassen
- ODMG Klasse (Methoden mit Code, Grundlage für Objekte, einfache Vererbung)
- ODMG Interface (kein Code, keine eigenen Objekte, nur Signatur)
das Modell unterscheidet zwischen Objekten und reinen Werten, beide können eine
komplexe
Struktur aufweisen aber nur Objekte haben eine ObjektID
4.4 OQL – Object Query Language
ist wie SQL deklarativ und dem SQL ähnlich
5. Object-Relational Mapping
nicht durchgesetzt – wie lassen sich Objekte auf relationale Strukturen „mappen“?
- Objektserialisierung
- Manuelles Mapping
- Mapping Tools
- OO DB’s
5.1 Software Architektur
erster Schritt in der Einführung einer Mehrschichtenarchitektur (von Anfang
kann gecodet werden)
Dreischichtenarchitektur konkretisiert die Struktur des Anwendungssystems
(Präsentation – Domäne – Speicher); die Domänenschickt repräsentiert das
Anwendungsgebiet
Mapping-Tools werden zwischen DB und Persistance Layer dargestellt
Studienbrief 03 – XML und Datenbanken
32. Was sind XML Dokumente?
Werden in vielen unterschiedlichen Anwendungen eingesetzt. Sind selbstbeschreibend. Enthalten Daten und
Struktur über Daten in einem Dokument.
33. Warum werden XML Dokumente klassifiziert?
XML-Dokumente können strukturierte Daten aber auch freie Informationen in Form von Volltext beinhalten.
Dies hat Einfluss auf Verarbeitung und Speicherung. Daher werden diese klassifiziert.
34. In welche Kategorien können XML Dokumente klassifiziert werden?
Datenzentriert, dokumentzentriert, semistrukturiert
Dies hat Einfluss auf Art der Speicherung sowie auf Auswahl der Abfragesprache
35. Erläutern Sie datenzentrierte XML Dokumente
Daten stehen im Mittelpunkt. Struktur im Hintergrund, diese dient lediglich zur Unterteilung und Strukturierung
der Daten. Meist werden sie aus bestehenen Informationsquellen generiert (relationale Datenbanken). Sind
meist gleich strukturiert (regulär) und haben strenge Regeln auf Typinformationen. Beispiele: elektronische
Kataloge, Bestellungen, Rechnungen, Fahrpläne, etc.
Dient häufig zur Suche nach Attributwerten oder Elementinhalten. Änderungen sind möglich.
36. Erläutern Sie dokumentzentrierte XML Dokumente
Informationen stecken in Daten und in Struktur. Meist fehlen Typinformationen, sind irregulär, meist direkt im
XML-Format geschrieben. Beispiele: wissenschaftliche Artikel, Inhalte von Bücher, Websites, etc. Es ist
sinnvoll, diese gesamt zu speichern, damit ursprüngliche Form wiederhersellbar..
Horizontale und vertikale Abfragen sind notwendig. Suchoperationen meist durch Volltextsuche. Änderungen
betreffen Attributwerte, Elementinhalte, Struktur und ganze Dokumentteile.
37. Erläutern Sie semistrukturierte XML Dokumente
Mischform aus daten- und dokumentzentriert. Beispiele: Bücher (Inhalte, Metadaten) oder
Hotelinformationen.
38. Wofür werden XML Dokumente bei IT-Systemen verwendet?
Zum Datenaustausch. Dauerhafte Speicherung und effiziente Datensuche im Dokumentenbestand ist häufig
notwendig. Dies sind meist Anforderungen im Zusammenhang mit Datenbanksystemen. Daher werden XML
Dokumente und Datenbanken zusammengeführt.
39. Erläutern Sie den Technologiezusammenhang XML und Datenbanken.
XML Dokumentformat für XML-Anfragen, Updates, Indizierung zur Speicherung in DB
Datenbanken für DB-Anfragen, Updates, Indizierung, Speicherung großer Datenmengen
Generiert XML Dokumente
40. Erläutern Sie die Visualisierung von Datenbankinhalten
Datenbankinhalte müssen für Darstellung aufbereitet werden, zB zur Darstellung einer Website. Dabei
fungieren XML Dokumente als Zwischenformat für eine weitere Aufbereitung mittels Stylesheet. XML wird
direkt aus Datenbank generiert - Schemabeschreibung. Transformation erfolgt dann meist über XLST zum
HTML.
41. Erläutern sie den Informationsaustausch in verteilten heterogenen Systemen
Zum Austausch zwischen Datenbanken oder Programmen. XML dient dann zum Austausch der
Informationen, da gemeinsame Ablage von Struktur und Daten leicht lesbar und analysierbar. Daher zum
Datenaustausch bzw. Kommunikation zwischen Komponenten (Schnittstellen). Datenbank/Programm 
Generierung (mit Schemabeschreibung) XML Dokumente  Abspeicherung bzw. XML Prozessoren 
Datenbank/Programm
42. Wie können XML Dokumente unterteilt werden?
In 3 Ebenen. Konzeptionell, logisch und physisch.
Konzeptionelle Ebene: Entwurf von XML Dokumenten
Logische Ebene: physische Darstellung, Bearbeitung, Abfrage und Speicherung von Dok.
Daten Datenmodell. Anfragen/Update an Inhalt
Semi  Daten- und Dokumentmodell. Anfrage/Update Struktur u. Inhalt
Dokument Dokumentmodell. Anfragen/Update an Struktur und Inhalt
Physische Ebene: Speicherung von XML Dokumenten. Abhängig von der Klasse
Speicherung in Verzeichnisbaum oder in Datenbanken.
Dokument Struktur auf Werteebene
Semi Struktur auf Secha- und Werteebene
Daten Struktur auf Schemaebene
43. Wie lassen sich Speichermethoden für XML Dokumente unterteilen?
• Speicherung der gesamten originalen XML Dokumente (Filesystem, CLOB Character Large Object
in DB). Dabei bleiben diese in ursprünglicher Form bestehen.
• Ablage der Graphstruktur
• Abbildung der Struktur von Dokumenten auf Struktur von Datenbanken. Speicherung der Daten
erfolgt innerhalb von Datenbankstrukturen
44. Definition XML-Datenbank?
• XML-Datenbank definiert (logisches) Modell für XML-Dokument. Erlaubt in Übereinstimmung mit
diesem Modell dann Speicherung und Zurücklieferung von Dokumenten. Zumindest müssen
Elemente, Attribute, #PCDATA und Dokumentenordnung enthalten sein. Beispiel: XPaht
Datenmodell, durch DOM implizierte Modell, Ereignisse in SAX.
• XML Dokumente sind fundamentale Einheit der logischen Speicherung. Sie sind vergleichbar mit
den Tupeln einer relationalen Datenbank.
• Ein bestimmtes Modell der physischen Speicherung ist nicht erforderlich. Es kann auf relationalen,
hierarchischen und ojektrelationalen Datenbanken aufgebaut werden. Auch proprietäre
Speicherformate (Indizes, komprimierte Files) können eingesetzt werden.
45. Wie können XML Datenbanken unterschieden bzw. eingeteilt werden?
Textbasiert: speichern XML Dokumente in Dateisystem oder CLOB.
Verwenden Indizes um Zugriff zu beschleunigen.
Modellbasiert: speichern in internes Objektmodell (DOM)
Beruht auf relationalen, objektorientierten oder hierarchischen Datenbank
46. Wie erfolgt der Zugriff auf XML Dokumente, die als Ganzes gespeichert sind?
Anwendung benötigen effiziente Abfragen für die Menge der gespeicherten Dokumente. Meist sequentiell,
das meist zu Performanceproblemen führt. Daher werden Indizes eingesetzt um Zugriffseffizienz zu steigern
und Antwortzeit zu verringern.
47. Welche Indizes werden bei XML Dokumenten verwendet? (Speicherung als Ganzes)
Volltextindex
Volltext- und Struktur-Index
48. Was ist der Volltextindex?
Einfachste Form eines Index für XML Dokumente. Dient Anfragen auf Volltexte.
49. Welche Teilaufgaben gibt es im Information Retrieval?
Deskribierung, Recherche, Ergebnispräsentation
50. Erläutern Sie die Verfahren der Teilaufgabe Deskribierung.
Dokumente werden durch unterschiedliche Verfahren aufbereitet.
Statistisch wortbasiert Häufigkeit auftretender Begriffe.
Stoppwortlisten (häufige Worte eliminiert)
Streichen von seltenen Begriffen (Selektivität! Index wird aber vergrößert)
Linguistisch: Wörter und Texte werden analysiert.
Stammwortreduktion, Wortnormalisierung, Wortdekomposition (teilen)
Wissensbasiert: Klassifikation (Themen und Oberthemen),
Thesauren (Synonyme, Anonyme, Über- und Unterbegriffe)
Ontologien für Indexbildung (Zusammenhang Begriff – Anwendungsgeb.)
Zugriff auf indexierte Daten zeitkritisch, Index-Aufbau nicht. Abfragen als boolesche Anfragen.
Hotel AND Wien
51. Erläutern Sie den kombinierten Volltext und Strukturindex
Erweiterung des Volltextindex um Informationen über Struktur. Index ist zweigeteilt und enthält Informationen
über Struktur und Volltext. Hier kann auch Struktur eines Dokumentes ausgewertet werden.
Hotel.ort contains (‚Wien’) AND hotel.stern contains (‚3’)
52. Was bedeutet DOM?
Document Object Model
53. Welche Ansätze gibt es bei der Speicherung von Dokumentstruktur für XML
Dokumente?
Abbildung auf relationale Datenbanken mit festem Schema (Stuktur wird auf fixe Relationen abgebildet)
Einsatz des DOM, um Daten in relationalen oder objektorientierten Datenbanken zu speichern (Abbild. DOM)
54. Erläutern Sie die Abbildung der Struktur auf fixe Relationen
Elemente und Attribute eines XML Dokuments werden auf Tabelle einer relationalen Datenbank abgebildet.
Elemente und Attribute werden jeweils in einer Tabelle abgelegt.
Elemente erhalten ID. Um die Hierarchie abbilden zu können, wird eine Spalte mitgeführt, welche die ID des
Vorgängerknotens enthält. Weiters wird eine Spalte geführt, welche die Ordnung der Elemente angibt.
Attribute werden in einer eigenen Tabelle gespeichert. Dabei erhalten Sie eine Referenz auf das jeweilige
Element.
Einfache Abfragen sind leicht realisierbar. Bei mehreren Elementen bzw. Attributen ist das Verfahren nicht
effizient.
55. Erläutern Sie die Abbildung von DOM Strukturen in Datenbanken.
DOM wurde zum Zugriff auf XML Dokumente entwickelt. Dient zur Abbildung von XML Dokumenten in
Datenbanken (objektorientiert oder relational). Einzelne Klassen werden wiederum auf fixe Relationen
abgebildet.
Node  Attr, Dokument, Element, Entity, Notation, … CharacterData (Comment, Text (CDataSection))
56. Erläutern Sie die Abbildung von Dokumentstrukturen auf Datenbankstrukturen
Dokumentinformationen werden auf strukturierte Objekte der Datenbank abgebildet. Da XML Dokumente
objektorientierten Charakter haben, bieten sich objektorientierte und objektrelationale Datenbanken an. Die
Struktur kann aber auch auf relationale Datenmodelle übertragen werden.
57. Erläutern Sie das vollständige Mapping bei Abbildung auf Objektorientierte bzw.
objektrelationale Datenbanken.
Um eine Abbildung durchführen zu können, muss zunächst ein DTD oder ein XML Schema vorhanden sein.

Create Table universität (name Carchar(50) …. Adresse ROW (plz varchar(10)…


58. Erläutern Sie das vollständige Mapping bei Abbildung auf relationale Datenbanken.
Ähnlich der Abbildung auf objektrelationale Datenbanken. Allerdings müssen zusätzlich bestehende
Hierarchien in flache Relationen umgesetzt werden. Universität und Adresse als eigene Relation.
59. Worauf muss beim Mapping geachtet werden?
Struktur der Datenbank richtet sich nach Struktur der XML Dokumente. Änderungen der Struktur muss im
Datenbankschema nachgezogen werden. Anfragen sind einfach als Datenbankabfragen realisierbar.
60. Wozu dienen Mapping Vorschriften?
Spezifizieren, welche Informationen im Dokument auf welche Strukturen in der Datenbank abgebildet werden.
61. Was sind die Vorteile und Nachteile von Mapping Vorschriften?
Vorteile: Inhalte eines Dokuments mit anderen Daten (unterschiedlicher Form)
Zusammengeführt werden sollen. Hohe Flexibilität
Nachteile: Erstellung der Vorschriften sehr aufwändig. Original nicht rekonstruierbar.
An fixes Datenbankschema gebunden.
62. Wozu dient XPath
Ermöglicht Adressierung von Teildokumenten innerhalb eines XML Dokuments. Eine Reihe von Operatoren
und Funktionen bilden Kern zur Extraktion und Aufbereitung der extrahierten Teile.
63. Wie betrachtet XPath ein XML Dokument?
XPath betrachtet XML Dokument als Baum. Knoten sind meist Elemente des Dokumentes.
Baumwurzel meist keine Entsprechung
Elemente bilden innere Knoten
Blätter Attribute, Textknoten, Kommentare
XPath-Ausdrücke Kontext aktueller Knoten, Position Knoten innerhalb Kontext, Größe Kontext, …
64. Erläutern Sie XPath Ausdrücke.
Werden als Pfadangaben angegeben, welche den Weg durch den Baum beschreiben und Knoten
adressieren. Die Bewegung durch den Baum erfolgt in Schritten, wobei jeder Schritt in der Syntax durch
einen / getrennt wird. Liefert eine Knotenmenge als Resultat.
Absolute Pfadangabe starten mit /
Relative Pfadangabe geht immer vom aktuellen Kontextknoten aus
/ Wurzelelement des Dokuments
/Students/Student alle student unter students
/Student leer – gibt es nicht
@ adressiert ein Attribut des aktuellen Knotens
Text() alle Textknoten
Comment() Kommentarknoten
65. Welche Selektionsprädikate kennen Sie?
/Students/Student[1]/CrsTaken[2] liefert 2.Kurs des 1. Studenten
/Students/Student/CrsTaken[last()] liefert letzten Elemente von Crs.. aller St.
/Students/Student[position() = 1] liefert den ersten Studenten
Logische Oeratoren AND, OR, …
Vergleichsoperatoren <,<=, >, >=, =, != . allerdings mit &lt“ und &gt“
Operationen auf num. Werten + - * mod div
Vereinigungsoperator | vereinigt Knotenmengen
Klammern Reihenfolge ( )
Wildcards // spricht alle Level unter dem aktuellen Knoten an
//CrsTaken alle Knoten unter root mit dem namen CrsTaken
Students//@Name alle Name Attribute unter Students
Students/*/text() alle Elemente
Students//@* alle Attribute
//Student[CrsTaken/@CrsCode=“CS532”]
//Student[Status=“U3” and starts-with(.//Last, “A”)
and contains(concat(.//@CrsCode), “ESE”)
and not(.//Last = .//First) ]
//Student[sum(.//@Grade) div count(.//@Grade) > 3.5]

66. Erläutern Sie XQuery.


XQuery ist eine Sprache. Integriert XPath mit anderen vorgeschlagenen Sprachen.
Studienbrief 04 – Verteilte Architekturen
67.
Relationale Datenbanken
68. Was sind Elemente einer relationalen Datenbank?
Tabelle, Feld, Eintrag, Schlüssel, Beziehung, Normalisierung
69. Welche Beziehungen gibt es in relationalen Datenbanken?
1:1, 1:n, m:n
70. Was ist eine relationale Datenbank?
Besteht aus Tabellen und Spalten, die sich aufeinander beziehen. Unterscheidet sich von hierarchischen
Dateisystemen
71. Was sind die Vorteile der relationalen Datenbank?
Intuitiv, vermeidet Redundanzen, erhält Integrität aufrecht
72. Was ist ein Schlüssel?
Primärschlüssel: eindeutiges Feld innerhalb der Datenbank, zur eindeutigen Unterscheidung
Fremdschlüssel: Primärschlüssel für verknüpfte Tabelle. Beziehung zwischen Tabellen.
Tragendes Element in relationalen Datenbanken.
73. Erläutern Sie die typische Form einer SQL-Abfrage
SELECT name, vorname, alter FROM Personen WHERE alter > 20
Ergebnis ist eine Relation
74. Erläutern Sie die SELECT clause
Entspricht der Porjektion (Felder, die angezeigt werden sollen)
SELECT name, vorname FROM Personen
75. Erläutern Sie DISTINCT
SELECT DISTINCT name … um Duplikate zu vermeiden
76. Erläutern Sie ALL
SELECT ALL name, vorname … lässt Duplikate zu
77. Erläutern Sie arithmetische Operationen in SELECT
SELECT betrag + 100 FROM price
78. Erläutern Sie die WHERE clause
Entspricht dem Prädikat
… WHERE alter > 20 AND kinder > 0
NOT, OR, AND, BETWEEN 10 AND 50
79. Erläutern Sie die FROM clause
Kartesisches Produkt aus Tabelle1 x Tabelle2
SELECT Name, Tabelle2.Kontonr, Betrag WHERE Tabelle1.Kontonr=Tabelle2.Kontonr AND Filiale = „Da“
80. Welche Mengen Operationen kennen Sie?
Union u, intersect n, except –
Entfernt alle Duplikate (asgenommen … ALL)
81. Erläutern Sie die Operation UNION.
Kriterium A, Kriterium B oder beide
SELECT name FROM Konto UNION SELECT name from Kredit
82. Erläutern Sie die Operation INTERSECT
Kriterium A und Kriterium B
SELECT name FROM konto INTERSECT SELECT name FROM kredit
83. Erläutern Sie Operation EXCEPT
Kriterum A OHNE Kriterium B
SELECT name FROM konto EXCEPT SELECT name FROM kredit
84. Welche arithmetischen Funktionen gibt es?
Avg (Durchschnitt) SELECT avg(alter) FROM personen WHERE gender = „m“
Min (kleinster Wert)
Max (größter Wert)
Sum (Summe der Werte)
Count (Zählen der Werte) SELECT count (*) FROM personen
SELECT count (distinct name)) FROM konto
85. Was ist ein Subquery
Verschachtelte Anfrage SELECT DISTINCT * FROM t1 WHERE n NOT IN (select name from t2)
86. Erläutern Sie den SOME Vergleich

87. Erläutern Sie den ALL Vergleich

88. Erläutern Sie weitere SQL Keywords


Group by
Having P
Order by (desc, asc)
Like % any substring, _ any character
AS
89. Erläutern Sie die UPDATE Anweisung
Update will gut überlegt sein. Reihenfolge beachten.
UPDATE Konto SET wert = wert*1.06 WHERE wert > 1000
UPDATE Konto SET wert = wert*1.05 WHERE wert < 1000
Oder
UPDATE konto
SET wert = CASE
WHEN wert <= 1000 THEN
wert*1.05
ELSE wert*1.06
END
90. Was bedeutet Normalisierung?
Technik zur Erstellung von klaren und logischen Beziehungen zwischen Tabellen. Bis zu 5 Graden.
91. Welche Vorteile bietet die Normalisierung?
Minimierung logischer Probleme
Einsparung von Speicherkapazitäten
Vermeidung von Redundanzen
Aufrechterhaltung von Datenintegrität
Erleichterung von Updates
92. Erläutern Sie die wichtigsten Normalformen.
1. Normalform Alle wiederholenden Spalten aussondern, in separate Spalten.
Atomare Werte
2. Normalform Alle Teilabhängigkeiten aussondern, in eigene Tabellen
3. Normalform Alle Daten, die kein Schlüssel sind, aussondern und trennen.