Online Analytical Processing
aus Wikipedia, der freien Enzyklopädie
Online-Analytical-Processing (OLAP) wird neben dem Data-Mining (auch Datenschürfung) zu den analytischen Informationssystemen gezählt. OLAP wird weiterhin den hypothesengestützten Analysemethoden zugeordnet. Der Analyst muss vor der eigentlichen Untersuchung wissen, welche Anfragen er an das OLAP-System stellen möchte. Seine Hypothese wird dann durch das Analyseergebnis bestätigt oder abgelehnt.
OLAP-Systeme beziehen ihre Daten entweder aus den operationalen Datenbeständen eines Unternehmens oder aus einem Data-Warehouse (Datenlager). Hierdurch wird verhindert, dass die Analysedaten mit den transaktionsorientierten Datenbeständen in Kontakt kommen und deren Leistungsfähigkeit beeinträchtigt wird. Ebenso ist die Leistung eines OLAP-Systems von der verwendeten Datenhaltungsform und deren Anbindung an den Analyse-Client abhängig.
Im Gegensatz zum Online Transaction Processing (OLTP) steht hier die Durchführung komplexer Analysevorhaben im Vordergrund, welche ein sehr hohes Datenaufkommen verursachen. Das Ziel ist, durch multidimensionale Betrachtung dieser Daten ein entscheidungsunterstützendes Analyseergebnis zu gewinnen. Als besondere Zielgruppe wird hier das Management in seiner Rolle als Entscheidungsträger genannt.
Die OLAP zugrunde liegende Struktur ist ein OLAP-Cube, der aus der operationalen Datenbank erstellt wurde. Dieser ist meist nach dem Sternschema aufgebaut, mit einer Faktentabelle und den jeweiligen Dimensionstabellen.
Inhaltsverzeichnis |
[Bearbeiten] Arten
Man unterscheidet zwischen ROLAP („relationales OLAP“), das auf eine relationale Datenbank zugreift, und MOLAP („Multidimensionales OLAP“). HOLAP („H“ für „Hybrid“) ist eine Zwischenform zwischen ROLAP und MOLAP. Jeder Typ hat seine Vor- und Nachteile. MOLAP kann schnell die Aggregationen berechnen. ROLAP skaliert besser, ist dafür aber langsamer als MOLAP. Dies liegt bei ROLAP daran, dass die Daten neben den teils vielleicht schon vorausberechneten Aggregationen in einer vielseitigen aber langsameren Datenbank gespeichert vorliegen, während diese Daten bei MOLAP in geeigneter, schnell zugänglicher Form meist direkt im Dateisystem abgespeichert sind. Daher bietet HOLAP oft einen guten Kompromiss aus ROLAP und MOLAP. Ein vierter Architekturtyp wird mit DOLAP (D für Desktop) bezeichnet. Hierbei werden die Basisdaten zunächst lokal in den Analyseclient importiert, um eine lokale Analyse vollziehen zu können. Als Nachteil kann hier allerdings eine evtl. zu schwache Hardwareauslegung gesehen werden. Zeitintensiv bei OLAP ist nicht die Auswertung der Daten sondern die Erstellung und Auffrischung der angelegten Cubes. Einen weiteren, neuerdings wieder sehr populären Typ stellt memory based OLAP dar. Hier werden alle Daten im RAM gehalten und alle Werte in Echtzeit berechnet. Diese Technik war in der Vergangenheit hinsichtlich der Datenmengen limitiert. Aufgrund der zunehmenden Verbreitung von 64 Bit Rechner-Architekturen können jedoch heutzutage auch grosse Datenmengen mit memory based OLAP analysiert werden.
OLAP-Werkzeuge werden häufig durch Multidimensionalität charakterisiert. Durch diese Multidimensionalität sollen relevante betriebswirtschaftliche Kennzahlen (bspw. Umsatz- oder Kostengrößen) anhand unterschiedlicher Dimensionen (z. B. Kunden, Regionen, Zeit) mehrdimensional betrachtet und bewertet werden können. Zur bildlichen Darstellung werden Würfel (Cube) verwendet. Diese Würfel sind unterteilt in verschiedene Dimensionen, die wiederum in Elemente untergliedert sind. Diese Elemente bilden einen Verdichtungsbaum oder allgemeiner einen nicht zyklischen gerichteten Graphen, welcher die Aggregationen darstellt.
[Bearbeiten] Anforderungen an ein OLAP-System
[Bearbeiten] 12 Regeln nach Codd
Der OLAP-Begriff wurde 1993 von Edgar F. Codd geprägt. Er formulierte zunächst 12 Regeln, die er bis zuletzt auf 18 Regeln erweitert hat. Diese Evaluierungsregeln stellten die erste Anforderungsliste an ein OLAP-System dar. Zwar werden diese Regeln noch gern aufgeführt, aber ihre Bedeutung für die Bewertung eines OLAP-Systems kann heute nicht mehr als besonders hoch eingestuft werden. Dies liegt im Besonderen an ihrer stark anwendungsbezogenen Ausrichtung und ihren teils umstrittenen Regeln. Die Regeln waren aus der Zusammenarbeit mit dem Unternehmen Arbor entstanden, das kurz zuvor die OLAP-Datenbank Essbase vorgestellt hatte – Essbase wird heute durch Hyperion Solutions weiterentwickelt und vertrieben.
Wegen ihres Pionierstatus werden die Regeln jedoch gern zitiert:
- Multidimensionale konzeptionelle Sicht auf die Daten (wichtigstes Kriterium für OLAP)
- Transparenz (klare Trennung zwischen Benutzerschnittstelle und der zu Grunde liegenden Architektur)
- Zugriffsmöglichkeiten (Bezug der Basisdaten aus externen oder operationalen Datenbeständen)
- Konsistente Leistungsfähigkeit der Berichterstattung (möglichst schnelle Reportingfunktionalität)
- Client-Server-Architektur (auf den Verwendungszweck optimierte Lastverteilung)
- Generische Dimensionalität (alle Dimensionen in ihrer Struktur und Funktionalität einheitlich)
- Dynamische Handhabung dünn besetzter Matrizen (dynamische Speicherstrukturanpassung)
- Mehrbenutzerunterstützung
- Unbeschränkte dimensionsübergreifende Operationen
- Intuitive Datenanalyse (direkte Navigation innerhalb der Datenwürfel)
- Flexibles Berichtswesen (Ergebnisse im Report frei anordenbar)
- Unbegrenzte Anzahl von Dimensionen und Konsolidierungsebenen (15 bis 20 Dimensionen mit beliebig vielen Aggregationsstufen)
[Bearbeiten] FASMI-Regeln nach Pendse und Creeth
Pendse und Creeth stellten 1995 (Lit.: Pendse) unter dem Akronym FASMI fünf herstellerunabhängige Evaluierungsregeln auf, um damit das OLAP-Konzept zu beschreiben. FASMI steht für „Fast Analysis of Shared Multidimensional Information“ und besagt im Einzelnen:
- Fast: Abfragen sollen durchschnittlich fünf Sekunden dauern dürfen. Dabei sollen einfache Abfragen nicht länger als eine Sekunde und nur wenige, komplexere Abfragen bis zu 20 Sekunden Verarbeitungszeit beanspruchen.
- Analysis: Ein OLAP-System soll jegliche benötigte Logik bewältigen können. Dabei soll die Definition einer komplexeren Analyseabfrage durch den Anwender mit wenig Programmieraufwand zu realisieren sein.
- Shared: Ein OLAP-System soll für den Mehrbenutzerbetrieb ausgelegt sein. Dies bedingt eine Verfügbarkeit geeigneter Zugriffsschutzmechanismen.
- Multidimensional: Als Hauptkriterium fordern Pendse und Creeth eine mehrdimensionale Strukturierung der Daten mit voller Unterstützung der Dimensionshierarchien.
- Information: Bei der Analyse sollen einem Anwender alle benötigten Daten transparent zur Verfügung stehen. Eine Analyse darf nicht durch Beschränkungen des OLAP-Systems beeinflusst werden.
Zusammenfassend lässt sich feststellen, dass die FASMI-Regeln stärker auf Benutzeranforderungen als auf technische Anforderungen eingehen. Insgesamt sind sie allerdings weniger spezifisch als die Regeln nach Codd, deswegen können nach dieser Definition wesentlich mehr Systeme dem OLAP zugeordnet werden.
[Bearbeiten] Marktübersicht
Im 2006er OLAP Report teilt sich der internationale OLAP-Markt wie folgt auf:
- Microsoft Corporation - 31.6%
- Hyperion Solutions - 18.9%
- Cognos - 12.9%
- Business Objects - 7.3%
- Microstrategy - 7.3%
- SAP AG - 5.8%
- Cartesis SA - 3.7%
- Applix - 3.6%
- Infor Global Solutions - 3.5%
- Oracle Corporation - 2.8%
Eine kostenlose Alternative stellte die OLAP-Datenbank_Palo dar.
[Bearbeiten] Literatur
- Nils Clausen: OLAP - Multidimensionale Datenbanken. Addison-Wesley-Longman, Bonn 1998, ISBN 3-8273-1402-X
- Edgar F. Codd, S. B. Codd, C. T. Salley: 'Providing OLAP to User-Analysts: An IT Mandate, Codd & Associates, Ann Arbor/Michigan 1993
- Bernd Held, Hartmut Erb: Advanced Controlling mit Excel. Unternehmenssteuerung mit OLAP und PALO, m. CD-ROM., Franzis, Poing 2006, ISBN 978-3-7723-7585-9
- Hartmut Messerschmidt, Kai Schweinsberg: OLAP mit dem SQL-Server. Eine Einführung in Theorie und Praxis. dpunkt, Heidelberg 2003, ISBN 3-89864-240-2
- Nigel Pendse, Richard Creeth: The OLAP Report. In: Business Intelligence. 1995
- Dr. Carsten Bange u.a.: 'OLAP & BI - 8 multidimensionale Datenbanken und 17 Reporting und Analyse-Werkzeuge im Vergleich Oxygon Verlag, München 2005, ISBN 3-93781-805-7
[Bearbeiten] Verwandte Begriffe
Wiktionary: OLAP – Bedeutungserklärungen, Wortherkunft, Synonyme und Übersetzungen |
[Bearbeiten] Weblinks
- The OLAP Report Sehr interessante kritische Analysen über das Thema von N. Pendse (englisch)
- Mondrian ist eine freie Implementierung eines OLAP-Systems
- HydraCube ist eine freie Implementierung eines OLAP-Systems
- Palo Open-Source OLAP-Datenbank Palo, Server für Windows/Linux und Microsoft Excel-Schnittstelle, Dokumentation, Demos und Forum
- JPalo Java-Software für Palo
- Microsoft OLAP Informationen ist eine Ansammlung Microsoft OLAP Informationen
- Marktübersicht OLAP und Business Intelligence Software Unabhängige Übersicht über Softwarewerkzeuge