Analysetechniken für große Datenbestände

Aufzeichnung der Vorlesung:

Informationen zu den Vorlesungsaufzeichnungen sind hier verfügbar.

Inhalt:

Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. In der Vorlesung geht es sowohl um die Aufbereitung von Daten als Voraussetzung für eine schnelle und leistungsfähige Analyse als auch um moderne Techniken für die Analyse an sich.

Lernziel:

Am Ende der Lehrveranstaltung sollen die Teilnehmer die Notwendigkeit von Konzepten der Datenanalyse gut verstanden haben und erläutern können. Sie sollen unterschiedliche Ansätze zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich der Vorlesung derzeit offen sind, und einen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Literaturhinweise

  • Data Mining: Practical Machine Learning Tools and Techniques (3rd edition): Ian H. Witten, Eibe Frank, mark A. Hall, Morgan Kaufmann Publishers 2011
  • Data Mining: Concepts and Techniques (3rd edition): Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011
  • Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000