Data Science 2

Aufzeichnung der Vorlesung:

Die Voresung wird aufgezeichnet und gestreamt.
Der Zugang zu den Vorlesungsaufzeichnungen erfolgt über den Stream Player der ATIS. Einen Downloadlink und nähere Informationen zum Player finden Sie hier.

Beschreibung:

Diese Vorlesung ersetzt die Vorlesung "Analysetechniken für große Datenbestände 2". Wir wollen dem Data Science Prozess mehr Aufmerksamkeit zukommen lassen und die Schritte dieses Prozesses explizit behandeln. – Data Science Techniken stoßen bei Anwendern auf großes Interesse, insbesondere für die Analyse großer Datenbestände. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mitmöglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. In dieser Vorlesung geht es sowohl um die Aufbereitung von Daten als Voraussetzung für eine schnelle und leistungsfähige Analyse als auch um moderne Techniken für die Analyse an sich. Die Lehrveranstaltung legt einen Schwerpunkt auf Phänomene und Techniken, die in der Vorlesung "Data Science 1" nicht betrachtet wurden; dies sind Ansätze für Datenströme, Besonderheiten hochdimensionaler Datenbestände, Erschließung von Datenbeständen mit Methoden der Informationsintegration und des Data Warehousing sowie Komprimierung und Sampling großer Datenbestände.

Ziel:

Am Ende der Lehrveranstaltung sollen die Teilnehmer die Notwendigkeit fortgeschrittener Konzepte im Bereich "Data Science" gutverstanden haben und erläutern können. Sie sollen eine große Vielfalt von fortgeschrittene Ansätzen zur Verwaltung und Analyse großer Datenbestände and Datenströme hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich Datenanalyse derzeit offen sind,und einen breiten und tiefen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Vortragssprache:

Die Vorlesung wird hauptsächlich auf Englisch stattfinden. Fragen können selbstverständlich auch auf Deutsch gestellt werden.