Datawarehouse
Gross Seminar
Mahdiyeh Motaghian-Jam
26.11.01
Einleitung





Motivation für die Einführung eines Data
Warehouse
Historischer Überblick
Definition eines Data Warehouse
Multidimensionale Datenmodelle
Einsatzmöglichkeiten von Data Warehouse
Systemen
Motivation
Informationen sind ein kritischer Erfolgsfaktor

Informationsbeschaffung muß nicht das Durchforsten des
Papierbestandes sein.

Informationsbeschaffung läßt sich durch Data Warehouse
automatisieren.
Motivation
Nutzung eines Data Warehouse:




Sofortige und flexible Verfügbarkeit von Berichten,
Statistiken und Kennzahlen.
Information über Zusammenhänge zwischen Markt und
Leistungsangebot (Kunden / Produkte und/oder
Dienstleistungen).
Umfassende Information über Geschäftsobjekte und
Zusammenhänge.
Detailinformation über Geschäftsobjekte und deren
Entwicklung über die Zeit, über Geschäftsprozesse und
deren Kosten und verbrauchte Ressourcen.
Historischer Überblick

Vor 1970 setzten sich Manager und andere Entscheidungsträger kaum
selbst mit der Datenbeschaffung auseinander, sondern erhielten diese
ausgedruckt auf Stapeln von Papier.

In den Achtziger Jahren kamen erste Datenmodelierungsmethoden auf.
Das erlaubte die Anforderungen an die Daten und die dazu benötigten
Strukturen formal zu dokumentieren.

Ende der Achtziger Jahre setzte sich die Unterscheidung zwischen
operativen und analytischen Informationssystemen durch.

Anfangs der Neunziger Jahre erkannte man einerseits, dass die bisher
gebräuchlichen Methoden für die Datenbeschaffung nicht robust genug
waren, um den zukünftigen Wachstum zu unterstützen.
Definition eines Datawarehouse
Ein Data Warehouse ist eine Sammlung von Technologien
zur Entscheidungsunterstützung, die es dem Anwender
erlauben soll, schneller bessere Entscheidungen zu treffen.

Sie erlaubt: effizienten Zugriff auf integrierte
Informationen. (meistens heterogenen Informationsquellen)

Und dient: als unternehmensweite Datenbasis für
Managementunterstützungssysteme.
Definition eines Datawarehouse
Vier Merkmale der Datawarehouse

subjektorientiert (Themenorientierung)
Ein Data Warehouse orientiert sich an den wichtigsten
Sachverhalten eines Unternehmens. Data Warehouse Daten sind
subjektorientert.(wie z.B. Kunden, Verkäufe, Produkte, Regionen)

integriert (Vereinheitlichung)
In einem Data Warehouse sind alle Daten integriert und zwar ohne
Ausnahme. Da diese Daten aus verschiedenen, heterogenen
Datenquellen stammen, müssen strukturelle und semantische
Unterschiede bereinigt werden, und die Daten müssen entsprechend
einem uniformen Datenmodell in Übereinstimmung gebracht
werden.
Vier Merkmale der Datawarehouse

nicht-volatil (Beständigkeit)
Der Zugang zu den Daten ist hauptsächlich read-only. Updates werden
im Umfeld der operativen Systeme vorgenommen. Änderungen der
DW-Daten nur, wenn die geänderten Datenquellen in das DW
übernommen werden.

variabel bezüglich der Zeit (Zeitorientierung)
Der Zeithorizont eines DW ist signifikant länger. Er beträgt 5- 10
Jahre. Bei DW-Systemen handelt es sich um historische Daten.
DW-Daten enthalten immer gewisse Zeitelemente wie Jahr, Monat,
Tag.
Abgrenzung operative Systeme vs. DW
Operative Systeme (Online Transaction Processing- OLTP):




Operative Daten repräsentieren den gegenwärtigen Zustand des
Unternehmens.
Werden eingesetzt bei strukturierten Aufgaben, die aus kurzen,
vordefinierten Transaktionen bestehen.
Entworfen, um eine schnelle und effiziente Ausführung einer großen
Anzahl von einfachen, vordefinierten read/write Transaktionen zu
behandeln.
Maximierung des Transaktionsdurchsatzes ist das grundlegende Ziel.
Abgrenzung operative Systeme vs. DW
Analytische Systeme (Online Analytical Processing OLAP):




Werden, basierend auf historischen Daten, für die Unternehmensführung
und –kontrolle gebraucht.
Enthalten konsolidierte, von mehreren operativen Datenbanken
integrierte Daten.
Hauptsächlich entworfen, um die Ausführung von komplexen,
ad hoc und meist read-only Anfragen zu unterstützen.
Anfragedurchsatz und Antwortzeit sind wichtiger als
Transaktionsdurchsatz.
Abgrenzung operative Systeme vs. DW
Architektur von DW Systemen
Datenerfassungsebene
Die Datenerfassungsebene umfaßt alle Aufgaben, die mit
dem Laden der Daten in das Data Warehouse
zusammenhängen, sowohl beim initialen Ladevorgang als
auch bei der periodischen Aktualisierung.
Besteht aus einer Vielzahl von Werkzeugen zur :




Extraktion
Bereinigung
Transformation
Laden der Daten in das Data Warehouse.
Datenhaltungsebene
Die Aufgabe der Datenhaltungsebene ist die
Speicherung der Daten im Data Warehouse.
Die Datenhaltung in Data Warehouses muß zwei
Hauptanforderungen erfüllen:


Sehr große Datenmengen zu speichern.
Schnelle Antwortzeiten auf OLAP-Anfragen möglich sein.
Datenbereitstellungsebene
Die Datenbereitstellungsebene besteht
üblicherweise aus einem OLAP-Server, der die
Daten des OLAP-Speichers an Front End Tools.
(wie z.B. Analyse-, Anfrage)

Auf diesen Daten muß eine multidimensionale
Analyse möglich sein.
Multidimensionales Datenmodell
Das zentrale Objekt einer multidimensionalen Struktur
wird Würfel (engl. Cube) genannt. Ein Würfel besteht aus
einer Menge von orthogonalen Kanten, den Dimensionen.
Elemente eines multidimensionalen Modells

Kennzahlen (Variablen)
Sie sind meist quantitative, in numerischer Form vorliegende Werte
(wie z.B. Umsatzdaten, kosten, verkaufte Produkte,...)
Betriebswirtschaftliche Variablen sind die eigentlichen Inhalte von
OLAP-Würfeln.

Dimensionen (betriebswirtschaftliche Entscheidungsobjekte)
Die Unterteilung von Geschäftsdaten nach verschiedenen
Blickwinkeln.
Zeitstruktur: z.B.
Tag Monat Quartal Jahr
OLAP (online Analytical Processing)

Mit OLAP wird eine Datenbanktechnologie bezeichnet, die
speziell für Ad hoc (on-line)- Auswertungen mit
komplexem (analytical) Charakter entwickelt wurde.

Diese Technologie ist sehr gut geeignet für Manager,
Controller, IT-Profis und Marketingleute. OLAP
ermöglicht es Ihnen, Ihre Unternehmens-Informationen aus
allen Blickwinkeln zu betrachten.
OLAP- Prinzip





subjektorienterite, beständige, integrierte und zeitbezogene Daten
(Extrakte aus DWH).
Daten werden in multidimensionaler Sicht (Extrakt aus dem Data
Warehouse) dargestellt.
Unterstützt Manipulation der Daten und der Betrachtungsweise.
Durch gute Antwortzeiten des Systems (gefordert < 15 Sekunden für
OLAP Berichte).
OLAP verwendet zur Datenhaltung entweder herkömmliche
relationale Datenbanken (ORACLE, Informix; Sybase, MS-SQL
Server, etc.) oder spezielle multidimensionale Datenbanken (TM1).
OLAP-Funktionen
OLAP wird durch folgende Funktionen charakterisiert
Navigation innerhalb der multidimensionalen Datensicht:

Drill-Down: innerhalb der Dimensionen zu detaillierteren
Daten, den Aggregationspfad hinunter wandern.

Roll-Up: innerhalb einer Dimensionen zu mehr
aggregierten Daten, den Aggregationspfad hinauf wandern.
OLAP-Funktionen

Pivote: (Rotate) betrachten der Daten mit aus
unterschiedlichen Perspektiven, vertauschen der
Reihenfolge der Dimensionen, welche dargestellt werden.

Slice: abschneiden einer Scheibe aus den
multidimensionalen Würfel.

Dice: ausschneiden eines Teilwürfels.
OLAP- Architekturen

ROLAP: Relational On Line Analytical Processing,
relationale Datenspeicherung – Tabellenform.

MOLAP: Multidimensional On Line Analytical
Processing, multidimensional Datenspeicherung, ndimensionaler Würfel.

HOLAP: Hybrid On Line Analytical Processing (HOLAP)
Speicherung eines Teils des DWH’s in Form von Würfeln.
OLAP- Architekturen
Einsatzmöglichkeiten von DW-Systemen






Marketing
Kundeninformation
Vertrieb
Produkt-Analyse
Personal-wesen
Buchhaltung
Zukunft der DW- Systeme

Der Data Warehouse- Markt betrug Ende 1998 bereits 8
Billionen US$ und der Trend ist nicht nachlassend.

Im Forschungsbereich gilt er als eines der heißesten
Themen.

Das Data Warehouse ist dynamisch und wird sich
kontinuierlich weiterentwickeln.
Ende
Danke für Ihre Aufmerksamkeit

Präsentation - Benutzer-Homepage