Praktikum Data Science
- Typ: Praktikum (P)
-
Lehrstuhl:
KIT-Fakultäten - KIT-Fakultät für Informatik - Institut für Programmstrukturen und Datenorganisation - IPD Böhm
KIT-Fakultäten - KIT-Fakultät für Informatik - Semester: SS 2025
-
Zeit:
Di. 22.04.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 29.04.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 06.05.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 13.05.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 20.05.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 27.05.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 03.06.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 17.06.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 24.06.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 01.07.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 08.07.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 15.07.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 22.07.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
Di. 29.07.2025
14:00 - 15:45, wöchentlich
50.34 Raum 301
50.34 INFORMATIK, Kollegiengebäude am Fasanengarten (3. Obergeschoss)
-
Dozent:
Prof. Dr.-Ing. Klemens Böhm
Federico Matteucci
TT-Prof. Dr. Peer Nowack
Jose Antonio Cribeiro Ramallo - SWS: 2
- LVNr.: 24874
- Hinweis: Präsenz
Inhalt | Im Rahmen des Praktikums „Analyse großer Datenbestände“ wird das theoretische Wissen aus der Vorlesung „Analysetechniken für große Datenbestände“ mit Hilfe gängiger Softwaretools praktisch vertieft. Die Veranstaltung teilt sich in zwei Blöcke: Einen zum aktuellen Stand der Technik und einen darüber hinausgehenden Themenblock mit offenen Forschungsfragen. Im ersten Block wird unter Anlehnung an den KDD-Prozess ein Anwendungsbeispiel für die Wissensextraktion und Datenexploration in einem Unternehmen durchgespielt. Hierbei werden die verschiedenen Data Mining Verfahren näher beleuchtet. Der Fokus liegt auf Verfahren zum Clustering, der Klassifikation sowie der Bestimmung von Frequent Itemsets und Association Rules. Im zweiten Block wird ein einzelner Schritt im KDD-Prozess und dessen Schwächen im Stand der Technik betrachtet. Die Studierenden werden für diese offenen Probleme sensibilisiert und angeleitet eigene Lösungsansätze zu diesen offenen Forschungsfragen zu entwickeln. Sowohl das Anwendungsbeispiel als auch die offenen Forschungsfragen werden in Teams bearbeitet. Im Praktikum soll das in der Vorlesung "Analysetechniken für große Datenbestände" erlernte Wissen über Data Mining in die Praxis umgesetzt werden. Dabei sollen die Studierenden gängige Softwaretools im Bereich Datenanalyse kennenlernen und diese in einer realen Anwendung einsetzen. Im ersten Teil des Praktikums sollen die Studierenden mit der Vorverarbeitung von Rohdaten sowie mit den Analyseschritten im KDD-Prozess vertraut gemacht werden. Sie sollen lernen wie man mit handelsüblichen Analysetools die bestmöglichen Ergebnisse in einer gegeben Anwendung erzielen kann. Im zweiten Teil des Praktikums sollen die Schwächen eines einzelnen Analyseschrittes näher untersucht werden. Die Studierenden werden mit ungelösten Problemen aus der Fachliteratur konfrontiert und lernen Lösungen dazu selbst zu entwickeln. Darüber hinaus sollen die Studenten lernen, im Team zusammenzuarbeiten, um die einzelnen Aufgaben erfolgreich zu lösen. |
Vortragssprache | Englisch |
Organisatorisches | Es muss ein Übungsschein aus der Vorlesung Analysetechniken für große Datenbestände, oder Vergleichbares in Form einer Studienleistung nach § 4 Abs. 3 SPO erbracht werden.
Die Anmeldung erfolgt ab Ende Februar über Ilias. |