Staging (Datenbank)
aus Wikipedia, der freien Enzyklopädie
Unter Staging versteht man in der Informatik einen Prozess in der Informationsintegration, in dem Daten in einem Datenbereich (engl.: staging area, der Bereitstellungsraum oder Sammelplatz beim Militär) temporär zwischengespeichert werden, um sie dort zu bereinigen und zu transformieren. Nach dem Bereinigungs- und Transformationsschritt werden die Daten in eine Zieldatenbank geladen.
[Bearbeiten] Staging und der ETL-Prozess
Staging wird typischerweise bei der Implementierung eines ETL-Prozesses verwendet. Dieser Prozess dient dazu, Daten aus einer Reihe von operativen Datenbanken in einer zentralen Datenbank - häufig ein Datenlager (data warehouse) - zusammenzuführen. Dort können die Daten mittels Methoden wie u. a. OLAP, Data-Mining, Text-Mining analysiert werden.
[Bearbeiten] Staging-Area
Die Daten werden dabei zunächst aus den Datenquellen extrahiert (extract) und in der Staging-Area gesammelt und zwischengespeichert. Dort werden die Daten bereinigt (cleanse, scrub) und transformiert (transform), ohne die Datenquellen weiter zu belasten. Die so aufbereiteten Daten werden abschließend aus der Staging-Area in die Zieldatenbank gespeichert (load). Die bereinigten Daten können auch genutzt werden, um die Daten in den jeweiligen Quell(system)en anzugleichen.