Praktikum: Data Warehousing und Mining

Anmeldung

Zur Anmeldung für das Praktikum wurde in der Vorlesung "Data Warehousing und Mining" im letzten Semester eine Anmeldeliste herumgegeben. Eine Liste für Restplätze liegt im Sekretariat von Prof. Böhm im Raum 367 des Informatikgebäudes (Geb. 50.34) aus. Alternativ können Sie sich per E-Mail an das Sekretariat unter Angabe von Name, Adresse, Matrikelnummer, Telefonnummer, Studiengang (Informatik/Inwi? Master/Diplom?) und Fachsemesterzahl anmelden.

Inhalt

Im Rahmen des Praktikums Data Warehousing und Mining wird das theoretische Wissen aus der zugehörigen Vorlesung mit Hilfe marktüblicher Tools praktisch vertieft. Die Veranstaltung teilt sich in mehrere Blöcke zu den Themen Data Warehousing und Data Mining. Blöcke bestehen aus Vorlesungen mit Einführungen in die notwendigen Funktionen der jeweiligen Tools sowie einer Phase, in welcher in Gruppen- oder Einzelarbeit eine Aufgabe gelöst wird. Am Ende eines Blocks wird der Lernfortschritt durch einen Tutor abgeprüft.

Ein beispielhaftes Anwendungsproblem aus dem Data-Mining-Bereich wird während der Teilnahme am DATA-MINING-CUP gelöst. In dieser Phase werden unter Anlehnung an den KDD-Prozess typische Vorgehensweisen sowie verschiedene Data-Mining-Verfahren näher beleuchtet. Der Fokus liegt auf Verfahren zum Clustering, der Klassifikation sowie der Bestimmung von Frequent Itemsets und Association Rules. Behandelte Data-Warehousing-Fragestellungen sind die Bereinigung von Daten sowie ETL-Prozesse zur letztendlichen Erstellung eines Data Warehouses.

Lernziele

Im Praktikum soll das in der Vorlesung “Data Warehousing und Mining” erlernte Wissen über Data Warehousing Systeme und Data Mining in die Praxis umgesetzt werden. Dabei sollen die Studierenden gängige Tools kennenlernen und einsetzen. Im Block Data Warehousing sollen die Studierenden mit dem Erstellen von Data Warehouses sowie mit dem Data-Cube-Modell vertraut gemacht werden, im Block Data Mining sollen die Studierenden die üblichen Mining Techniken kennenlernen. Sie werden mit den typischen Problemen konfrontiert und lernen, Lösungen zu entwickeln. Darüber hinaus sollen die Studenten lernen, im Team zusammenzuarbeiten, um die einzelnen Aufgaben erfolgreich zu lösen.

Material

Folien und weiteres Material zum Praktikum im Studierendenportal

Literatur

M. Berthold, C. Borgelt, F. Höppner und F. Klawonn: “Guide to Intelligent Data Analysis”, Springer-Verlag, 2010
J. Han und M. Kamber: "Data Mining: Concepts and Techniques", Morgan Kaufmann, 2006.
I. H. Witten und E. Frank: "Data Mining - Practical Machine Learning Tools and Techniques", Morgan Kaufmann, 2005.
D. Hand, H. Mannila und P. Smyth: "Principles of Data Mining", MIT Press, 2001.
L. I. Kuncheva: "Combining Pattern Classifiers", Wiley-Interscience, 2004.
A. Bauer, H. Günzel: "Data Warehouse Systeme – Architektur, Entwicklung, Anwendung", dpunkt.verlag, 2004.
T. Mitchell: “Machine Learning”, McGraw Hill, 1997.