Aktuelle Data-Mining Techniken für komplexe Datenbestände

Zusammenfassung

Heutige Datenbanktechnologien ermöglichen es, Datensätze von enormem Umfang zu erfassen. Data Mining beschäftigt sich mit dem Ziel aus diesen Datenbanken Wissen zu extrahieren. Die wachsende Komplexität der Rohdatenbestände stellt dabei eine große Herausforderung für die Entwicklung neuer Data Mining Verfahren dar. Von großer Bedeutung sind dabei vor allem Techniken, die neues Wissen generieren können und dabei vom Anwender keinerlei Vorkenntnisse über die Daten voraussetzen. Damit ist es möglich, in einem Datensatz automatisch unerwartete oder neue Muster zu identifizieren. Im diesem Seminar wollen wir im Speziellen Outlier Mining Techniken betrachten, als Beispiel für ein aktuelles Forschungsgebiet an unserem Lehrstuhl.

In der Praxis bieten Outlier Mining Verfahren ein breites Anwendungsspektrum. Zu den möglichen Einsatzgebieten zählen unter anderem medizinische Anwendungen zur automatischen Patientenüberwachung, Erkennung von Betrugsfällen innerhalb elektronisch erfasster Kundensysteme oder das Kontrollieren von Datenströmen aus Sensornetzen. Die Herausforderungen des Outlier Minings liegen dabei in der Komplexität der zugrundeliegenden Datensätze. Gegenstand aktueller Forschung sind daher spezielle Ansätze, die beispielsweise für den Einsatz auf hoch-dimensionalen Datenbanken oder komplexen Informationsnetzwerken (z.B. soziale Netzwerke) optimiert sind.

Im Rahmen dieser Veranstaltung werden zunächst einführende Konzepte und grundlegende Outlier Mining Techniken in Proseminarvorträgen behandelt. Darauf aufbauend sollen einige fortgeschrittene Verfahren als Seminarthemen vorgestellt und verglichen werden.