Data Warehousing and Mining

Aufzeichnung der Vorlesung

Der Zugang zu den Vorlesungsaufzeichnungen erfolgt über den Stream Player der ATIS.

Zusammenfassung

Data Warehouses und Data Mining stoßen bei Anwendern mit großen Datenmengen, z.B. in den Bereichen Handel, Banken oder Versicherungen, auf großes Interesse. Hinter beiden Begriffen steht der Wunsch, in sehr großen, z.T. verteilten Datenbeständen die Übersicht zu behalten und mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren. Ein Data Warehouse ist ein Repository, das mit Daten von einer oder mehreren operationalen Datenbanken versorgt wird. Die Daten werden so aufbereitet, daß die schnelle Evaluierung komplexer Analyse-Queries (OLAP, d.h. Online Analytical Processing) möglich wird. Bei Data Mining steht dagegen im Vordergrund, daß das System selbst Muster in den Datenbeständen erkennt.

Stichpunkte zum Inhalt

  • Multidimensionale Datenmodelle: OLAP vs. OLTP, deklarativer Zugriff in multidimensionalen Datenmodellen und andere Interaktionsmechanismen,
  • Datenqualität, Data Cleaning,
  • Architektur von Data Warehouses, Konzepte des physischen Entwurfs,
  • Komprimierung multidimensionaler Daten und approximative Anfrageergebnisse,
  • Association Rules: Algorithmen für das Finden von Association Rules, Interessantheit, Quantitative Association Rules,
  • Clustering in niedrig- und hochdimensionalen Merkmalsräumen,
  • Klassifizierung - Verfahren für große Datenbestände,
  • Umsetzung von Warehousing und Data-Mining Konzepten in kommerziellen Datenbanksystemen,
  • Zeitreihenanalyse und Forecasting,
  • Data Mining und Privatheit.
    Buchempfehlung

Literaturhinweise

Data Mining: Concepts and Techniques.Autoren: Jiawei Han, Micheline Kamber

Kontakt

Dozent: Prof. Dr. Klemens Böhm, klemens dot boehm at kit dot edu