IPD Böhm - Lehre - Lehrveranstaltungen

Data Science 1

Typ: Vorlesung (V)
Lehrstuhl: KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Programmstrukturen und Datenorganisation - IPD Böhm
KIT-Fakultäten - KIT-Fakultät für Informatik
Semester: WS 22/23
Zeit: Mo 24.10.2022
09:45 - 11:15
weitere...

Mo 24.10.2022
14:00 - 15:30, wöchentlich

Mo 31.10.2022
14:00 - 15:30, wöchentlich

Mo 07.11.2022
09:45 - 11:15

Mo 07.11.2022
14:00 - 15:30, wöchentlich

Mo 14.11.2022
14:00 - 15:30, wöchentlich

Mo 21.11.2022
09:45 - 11:15

Mo 21.11.2022
14:00 - 15:30, wöchentlich

Mo 28.11.2022
14:00 - 15:30, wöchentlich

Mo 05.12.2022
09:45 - 11:15

Mo 05.12.2022
14:00 - 15:30, wöchentlich

Mo 12.12.2022
14:00 - 15:30, wöchentlich

Mo 19.12.2022
09:45 - 11:15

Mo 19.12.2022
14:00 - 15:30, wöchentlich

Mo 09.01.2023
14:00 - 15:30, wöchentlich

Mo 16.01.2023
09:45 - 11:15

Mo 16.01.2023
14:00 - 15:30, wöchentlich

Mo 23.01.2023
14:00 - 15:30, wöchentlich

Mo 30.01.2023
09:45 - 11:15

Mo 30.01.2023
14:00 - 15:30, wöchentlich

Mo 06.02.2023
14:00 - 15:30, wöchentlich

Mo 13.02.2023
09:45 - 11:15

Mo 13.02.2023
14:00 - 15:30, wöchentlich
SWS: 3
LVNr.: 24114
Hinweis: Online

Links

ILIAS-Kurs

Inhalt: Diese Vorlesung ersetzt die Vorlesung "Analysetechniken für große Datenbestände" (Big Data Analytics I).
Wir wollen dem Data Science Prozess mehr Aufmerksamkeit zukommen lassen und die Schritte dieses Prozesses explizit behandeln.
Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse.
Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften.
In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können.
Diese Vorlesung behandelt die notwendigen Schritte zur Extraktion von Wissen aus Daten, Techniken zur Aufbereitung der Daten bis hin zu grundlegenden Modellen zur Extraktion von Wissen, z. B. in Form von Statistiken, Assoziationsregeln, Clustern oder systematischen Vorhersagen.
Am Ende der Lehrveranstaltung sollen die Teilnehmer ein gutes Verständnis des Data Science Prozesses haben, d. h. des Prozesses der Generierung praktischer Erkenntnisse aus großen Datenbeständen und der verschiedenen Schritte dieses Prozesses.
Sie sollen Ansätze zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können.
Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich der Vorlesung derzeit offen sind, und einen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Vortragssprache: Englisch
Literaturhinweise:
Data Mining: Concepts and Techniques (3rd edition):Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011
Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014
Introduction to Data Mining: Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000
Organisatorisches: Diese Lehrveranstaltung kann nicht belegt werden, wenn Data Mining [2520375] belegt wurde/wird.
Empfehlungen: Datenbankkenntnisse, z.B. aus der Vorlesung Datenbanksysteme