Data Science 1

  • Typ: Vorlesung (V)
  • Lehrstuhl: KIT-Fakultät für Informatik - Institut für Programmstrukturen und Datenorganisation - IPD Böhm
  • Semester: WS 21/22
  • Ort:

    Geb. 50.34 Raum -101, Stream und Aufzeichnung

  • Zeit:

    Montag 14 tg. von 10:00 - 11:30 Uhr
    Montag wöchentlich von 14:00 - 15:30 Uhr

  • Dozent:

    Dr.-Ing. Edouard Fouché

    Jakob Bach (Übung)

  • SWS: 3
  • ECTS: 5
  • LVNr.: 24114

Beschreibung:

Diese Vorlesung ersetzt die Vorlesung "Analysetechniken für große Datenbestände" (Big Data Analytics I). Wir wollen dem Data-Science-Prozess mehr Aufmerksamkeit zukommen lassen und die Schritte dieses Prozesses explizit behandeln. – Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse. Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften. In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können. Diese Vorlesung behandelt die notwendigen Schritte zur Extraktion von Wissen aus Daten, Techniken zur Aufbereitung der Daten bis hin zu grundlegenden Modellen zur Extraktion von Wissen, z. B. in Form von Statistiken, Assoziationsregeln, Clustern oder systematischen Vorhersagen.

Ziel:

Am Ende der Lehrveranstaltung sollen die Teilnehmer ein gutes Verständnis des Data Science Prozesses haben, d. h. des Prozesses der Generierung praktischer Erkenntnisse aus großen Datenbeständen, und der verschiedenen Schritte dieses Prozesses.  Sie sollen Ansätze zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können. Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich der Vorlesung derzeit offen sind, und einen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Literaturhinweise:

  • Data Mining: Concepts and Techniques (3rd edition):Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011
  • Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014
  • Introduction to Data Mining:Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
  • Knowledge Discovery in Databases:Martin Ester, Jörg Sander, Springer 2000