Analysetechniken für große Datenbestände
- Typ: Vorlesung (V)
- Semester: WS 20/21
-
Zeit:
Dienstag wöchentlich von 08:00 - 09:30 Uhr
Dienstag 14 tg. von 12:00 - 13:30
Geb. 50.34 Raum -101
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (1. Untergeschoss)
-
Dozent:
Jakob Bach (Übung)
- SWS: 3
- LVNr.: 24114
Medien:
Aufzeichnung und Stream
Weitere Informationen und alle Unterlagen finden sich im ILIAS-Kurs der Vorlesung.
Beschreibung:
Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. In der Vorlesung geht es sowohl um die Aufbereitung von Daten als Voraussetzung für eine schnelle und leistungsfähige Analyse als auch um moderne Techniken für die Analyse an sich.
Ziel:
Am Ende der Lehrveranstaltung sollen die Teilnehmer die Notwendigkeit von Konzepten der Datenanalyse gut verstanden haben und erläutern können. Sie sollen unterschiedliche Ansätze zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich der Vorlesung derzeit offen sind, und einen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.
Literaturhinweise:
- Data Mining: Practical Machine Learning Tools and Techniques (3rd edition): Ian H. Witten, Eibe Frank, mark A. Hall, Morgan Kaufmann Publishers 2011
- Data Mining: Concepts and Techniques (3rd edition): Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011
- Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000