Data-Warehouse-Prozess

Der Data-Warehouse-Prozess (englisch data warehousing) ist der Prozess zur Bewirtschaftung und Auswertung eines Data-Warehouses (Datenlager), der die folgenden Schritte umfasst:

  1. Datenbeschaffung: das heißt die Extraktion der relevanten Daten aus den Quellsystemen, Transformation und gegebenenfalls Datenbereinigung in einem Arbeitsbereich sowie Laden in das Data-Warehouse. Dieser Schritt wird auch Extract-Transform-Load-Prozess (ETL-Prozess) genannt.
  2. Datenhaltung: das heißt die langfristige Speicherung der Daten im Data-Warehouse
  3. Versorgung und Datenhaltung der für die Analyse notwendigen separaten Datenbestände, den Data-Marts
  4. Datenauswertung durch Analyse der Daten im jeweiligen Data Mart bzw. Versorgung nachgelagerter Anwendungssysteme

Dabei ist bei allen Schritten das Repositorium eingebunden, das insbesondere beim ETL-Prozess mit Metadaten versorgt wird und insbesondere bei der Analyse der Daten genutzt wird.

Siehe auch

  • Data-Warehouse-System
  • Business Intelligence
  • Data-Mining

Literatur

  • A. Bauer, H. Günzel: Data Warehouse Systeme – Architektur, Entwicklung, Anwendung. dpunkt, 2013, ISBN 978-3-89864-785-4.
  • W. Lehner: Datenbanktechnologie für Data-Warehouse-Systeme, Konzepte und Methoden. dpunkt, 2002, ISBN 3-89864-177-5.
  • Data Warehousing als Organisationskonzept des Datenmanagements
  • Bernhard Strauch, Robert Winter: Vorgehensmodelle für die Informationsbedarfsanalyse im Data Warehousing. (PDF; 231 kB)
  • Data Warehousing braucht Prozessdenken. (Memento vom 17. Dezember 2015 im Internet Archive) (PDF; 4112 kB)