Data Science 1

  • Typ: Vorlesung (V)
  • Lehrstuhl: KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Programmstrukturen und Datenorganisation - IPD Böhm
    KIT-Fakultäten - KIT-Fakultät für Informatik
  • Semester: WS 22/23
  • Zeit: Mo 24.10.2022
    09:45 - 11:15


    Mo 24.10.2022
    14:00 - 15:30, wöchentlich

    Mo 31.10.2022
    14:00 - 15:30, wöchentlich

    Mo 07.11.2022
    09:45 - 11:15

    Mo 07.11.2022
    14:00 - 15:30, wöchentlich

    Mo 14.11.2022
    14:00 - 15:30, wöchentlich

    Mo 21.11.2022
    09:45 - 11:15

    Mo 21.11.2022
    14:00 - 15:30, wöchentlich

    Mo 28.11.2022
    14:00 - 15:30, wöchentlich

    Mo 05.12.2022
    09:45 - 11:15

    Mo 05.12.2022
    14:00 - 15:30, wöchentlich

    Mo 12.12.2022
    14:00 - 15:30, wöchentlich

    Mo 19.12.2022
    09:45 - 11:15

    Mo 19.12.2022
    14:00 - 15:30, wöchentlich

    Mo 09.01.2023
    14:00 - 15:30, wöchentlich

    Mo 16.01.2023
    09:45 - 11:15

    Mo 16.01.2023
    14:00 - 15:30, wöchentlich

    Mo 23.01.2023
    14:00 - 15:30, wöchentlich

    Mo 30.01.2023
    09:45 - 11:15

    Mo 30.01.2023
    14:00 - 15:30, wöchentlich

    Mo 06.02.2023
    14:00 - 15:30, wöchentlich

    Mo 13.02.2023
    09:45 - 11:15

    Mo 13.02.2023
    14:00 - 15:30, wöchentlich


  • Dozent: Dr.-Ing. Edouard Fouché
  • SWS: 3
  • LVNr.: 24114
  • Hinweis: Online

Inhalt: Diese Vorlesung ersetzt die Vorlesung "Analysetechniken für große Datenbestände" (Big Data Analytics I).
Wir wollen dem Data Science Prozess mehr Aufmerksamkeit zukommen lassen und die Schritte dieses Prozesses explizit behandeln.
Techniken zur Analyse großer Datenbestände stoßen bei Anwendern auf großes Interesse.
Das Spektrum ist breit und umfasst klassische Branchen wie Banken und Versicherungen, neuere Akteure, insbesondere Internet-Firmen oder Betreiber neuartiger Informationsdienste und sozialer Medien, und Natur- und Ingenieurswissenschaften.
In allen Fällen besteht der Wunsch, in sehr großen, z. T. verteilten Datenbeständen die Übersicht zu behalten, mit möglichst geringem Aufwand interessante Zusammenhänge aus dem Datenbestand zu extrahieren und erwartetes Systemverhalten mit dem tatsächlichen systematisch vergleichen zu können.
Diese Vorlesung behandelt die notwendigen Schritte zur Extraktion von Wissen aus Daten, Techniken zur Aufbereitung der Daten bis hin zu grundlegenden Modellen zur Extraktion von Wissen, z. B. in Form von Statistiken, Assoziationsregeln, Clustern oder systematischen Vorhersagen.
Am Ende der Lehrveranstaltung sollen die Teilnehmer ein gutes Verständnis des Data Science Prozesses haben, d. h. des Prozesses der Generierung praktischer Erkenntnisse aus großen Datenbeständen und der verschiedenen Schritte dieses Prozesses.  
Sie sollen Ansätze zur Verwaltung und Analyse großer Datenbestände hinsichtlich ihrer Wirksamkeit und Anwendbarkeit einschätzen und vergleichen können.
Die Teilnehmer sollen verstehen, welche Probleme im Themenbereich der Vorlesung derzeit offen sind, und einen Einblick in den diesbezüglichen Stand der Forschung gewonnen haben.

Vortragssprache: Englisch
Literaturhinweise:
Data Mining: Concepts and Techniques (3rd edition):Jiawei Han, Micheline Kamber, Jian Pei, Morgan Kaufmann Publishers 2011
Data Mining and Analysis, Fundamental Concepts and Algorithms: Mohammed J. Zaki, Wagner Meira JR., Campridge University Press 2014
Introduction to Data Mining: Pang-Ning Tan, Michael Steinbach, Vipin Kumar, Addison-Wesley 2006
Knowledge Discovery in Databases: Martin Ester, Jörg Sander, Springer 2000
Organisatorisches: Diese Lehrveranstaltung kann nicht belegt werden, wenn Data Mining [2520375] belegt wurde/wird.
Empfehlungen: Datenbankkenntnisse, z.B. aus der Vorlesung Datenbanksysteme