Software-Entwicklung: Datenbank-Anwendung für die Speicherung und Abfrage von komprimierten Zeitreihen

type: Vorlesung (V)
semester: WS 13/14
time:
Dates:

Tuesday, 5th November, 14:00 - 15:30
Tuesday, 12th November, 14:00 - 15:30

from 18th November 2013,
Monday weekly, 11:30 - 13:00
till 17th of March

SR 348 (3. Stock)
50.34 Informatik, Kollegiengebäude am Fasanengarten

Holidays: 23.12.2013 - 06.01.2014

The alternate date for the 06th Januar will be held on 7th Januar 14:00 - 15:30 Uhr.

SR 348 (3rd floor)
50.34 Informatik, Kollegiengebäude am Fasanengarten
lecturer:
Prof.Dr.Ing. Klemens Böhm

Pavel Efros
sws: 4
lv-no.: https://campus.studium.kit.edu/events/catalog.php?page=event.asp&objgguid=NEW&gguid=0x5d5ce30afe0d0543ba5d9beaa31906d2

Motivation:

Zeitreihen werden in großem Umfang in vielen Lebensbereichen erhoben. Als Beispiel kann man das zukünftige Energiesystem nennen, in dem bald in jedem Haushalt ein intelligenter Stromzähler installiert wird. Dieser wird den aktuellen Energieverbrauch des Haushaltes öfter als zuvor erfassen und weiterleiten können, z. B. einmal pro Sekunde. Die daraus resultierende Menge an Daten erfordert entsprechende Rechenleistung für die Analyse und Speicherplatz.

Eine Lösung, um die Datenmenge zu reduzieren, ist Komprimierung, beispielsweise durch eine stückweise Approximation mit mathematischen Funktionen. Jüngste Forschung hat diverse Methoden entwickelt, basierend auf unterschiedlichen mathematischen Funktionen. Allerdings wurde die Frage, wie man derart komprimierte Daten in einer Datenbank am schnellsten bearbeitet oder abfragt, bisher nicht wirklich beantwortet. Die Nützlichkeit der Komprimierungstechniken ergibt sich jedoch genau an dieser Stelle.

Aufgabenbeschreibung:

Ziel des Projektes ist die Erstellung einer prototypischen Datenbank-Anwendung für die Speicherung und Abfrage von Zeitreihen, die durch stückweise Approximation mit mathematischen Funktionen komprimiert wurden. Als erster Schritt soll die Implementierung von SELECT-PROJECT-JOIN Funktionalität in zwei unterschiedlichen Versionen erfolgen. Die erste soll die Daten zuerst dekomprimieren und die Anfragen auf die dekomprimierten Daten ausführen. Die zweite Version soll es versuchen, Anfragen auszuführen, so weit wie möglich ohne die Daten zu dekomprimieren. Es genügt, WHERE-Klauseln mit einfachen Bedingungen (<, >, =) zu betrachten. In einem nächsten Schritt können ebenso in zwei Versionen Aggregationsanfragen implementiert werden, bei denen z. B. die Summe oder Ordnungsstatistiken (z. B. Minimum, Maximum) eines Teils der Zeitreihe betrachtet werden. Implementierungen der Approximationsalgorithmen, sowie entsprechende Test-Datensätze, sind vorhanden.