Datenhaltung in der Cloud

  • Typ: Vorlesung (V)
  • Lehrstuhl: Fakultät für Informatik
  • Semester: WS 14/15
  • Zeit:

    Dienstag, 11:30-13:00 Uhr, wöchentlich

    Mittwoch, 08:00-09:30 Uhr, 14-tägig

    Raum -101 (-1. Stock)
    50.34 Informatik, Kollegiengebäude am Fasanengarten

  • Dozent: Prof.Dr.Ing. Klemens Böhm
  • SWS: 2
  • LVNr.: https://campus.studium.kit.edu/events/catalog.php?page=event.asp&objgguid=NEW&gguid=0x995944B631859C4D88B494DCA2DB88B0
  • Eigentümer großer Datenbestände gehen verstärkt dazu über, ihre Daten nicht mehr selbst zu verwalten, sondern sie in die Cloud zu verlagern und dort verwalten zu lassen. 'Datenbestände' bedeutet für einen großen Teil der Nutzer strukturierte Datenbestände, und der Zugriff soll mit gängigen Sprachen (gemeint ist: SQL-artige Sprachen) möglich sein.
    Das Bereitstellen und der Betrieb einer entsprechenden Infrastruktur in einer profitablen Weise ist herausfordernd.
    Das Anliegen der Vorlesung ist die Vorstellung wesentlicher Konzepte und des derzeitigen Stands der Kunst (der noch Luft nach oben lässt). Verkürzt gesagt ist der Betrieb einer Cloud-Infrastruktur nur dann profitabel, wenn es gelingt, (fast) alle Vorgänge zu automatisieren.
    Die Vorlesung wird deshalb zunächst auf Ansätze für die effiziente Implementierung und das Self-Tuning von Datenbanksystemen eingehen, die bereits vor dem Aufkommen von 'Cloud' existiert haben und Eingang in kommerziell verfügbare Technologie gefunden haben, aber eben auch für die Datenverwaltung in der Cloud unverzichtbar sind.
    Die Vorlesung wird dann ausführlich (systematisch, aber ohne den Anspruch der Vollständigkeit, im Wesentlichen anhand ausgewählter, überzeugender Beispiele) darstellen, welche implizit und explizit darauf aufbauenden Ansätze für die Datenhaltung in der Cloud existieren.
    D. h. diese Lehrveranstaltung ist interessant für Sie, wenn Sie sich für die Arbeitsweise von Cloud-Infrastrukturen interessieren, aber auch, wenn Sie -- losgelöst vom Cloud-Kontext -- grundsätzliches Interesse an der Arbeitsweise moderner Datenbanksysteme, seien sie relational, seien es NoSQL-Systeme, haben.

    Stichworte zum Inhalt: Verarbeitung deklarativer Anfragen in der Cloud, automatisiertes Storage Provisioning, Konsistenz verteilter Datenbestände, Zugriffskontrollmechanismen speziell für die Cloud, Arbeiten mit Stichproben großer Datenbestände.

     

     

    Literaturhinweise:

    Wird in der Vorlesung bekannt bekanntgegeben, Grundlagen finden sich in den folgenden Büchern:

    • Database Systems Implementation, by Hector Garcia-Molina, Jeff Ullman, and Jennifer Widom.
    • Concurrency Control and Recovery in Database Systems, by Philip A. Bernstein, Vassos Hadzilacos, and Nathan Goodman.
    • Data Management in the Cloud, Challenges and Opportunities, Divyakant Agrawal, Sudipto Das and Amr El Abbadi
    -->

Aufzeichnung der Vorlesung:

Der Zugang zu den Vorlesungsaufzeichnungen erfolgt über den Stream Player der ATIS. 

Vorlesungsmaterialien:

 Die Vorlesungsfolien und andere Vorlesungsmaterialien finden Sie hier.

 

Beschreibung:

Eigentümer großer Datenbestände gehen verstärkt dazu über, ihre Daten nicht mehr selbst zu verwalten, sondern sie in die Cloud zu verlagern und dort verwalten zu lassen. 'Datenbestände' bedeutet für einen großen Teil der Nutzer strukturierte Datenbestände, und der Zugriff soll mit gängigen Sprachen (gemeint ist: SQL-artige Sprachen) möglich sein.
Das Bereitstellen und der Betrieb einer entsprechenden Infrastruktur in einer profitablen Weise ist herausfordernd.
Das Anliegen der Vorlesung ist die Vorstellung wesentlicher Konzepte und des derzeitigen Stands der Kunst (der noch Luft nach oben lässt). Verkürzt gesagt ist der Betrieb einer Cloud-Infrastruktur nur dann profitabel, wenn es gelingt, (fast) alle Vorgänge zu automatisieren.
Die Vorlesung wird deshalb zunächst auf Ansätze für die effiziente Implementierung und das Self-Tuning von Datenbanksystemen eingehen, die bereits vor dem Aufkommen von 'Cloud' existiert haben und Eingang in kommerziell verfügbare Technologie gefunden haben, aber eben auch für die Datenverwaltung in der Cloud unverzichtbar sind.
Die Vorlesung wird dann ausführlich (systematisch, aber ohne den Anspruch der Vollständigkeit, im Wesentlichen anhand ausgewählter, überzeugender Beispiele) darstellen, welche implizit und explizit darauf aufbauenden Ansätze für die Datenhaltung in der Cloud existieren.
D. h. diese Lehrveranstaltung ist interessant für Sie, wenn Sie sich für die Arbeitsweise von Cloud-Infrastrukturen interessieren, aber auch, wenn Sie -- losgelöst vom Cloud-Kontext -- grundsätzliches Interesse an der Arbeitsweise moderner Datenbanksysteme, seien sie relational, seien es NoSQL-Systeme, haben.

Stichworte zum Inhalt: Verarbeitung deklarativer Anfragen in der Cloud, automatisiertes Storage Provisioning, Konsistenz verteilter Datenbestände, Zugriffskontrollmechanismen speziell für die Cloud, Arbeiten mit Stichproben großer Datenbestände.

 

 

Literaturhinweise:

Wird in der Vorlesung bekannt bekanntgegeben, Grundlagen finden sich in den folgenden Büchern:

  • Database Systems Implementation, by Hector Garcia-Molina, Jeff Ullman, and Jennifer Widom.
  • Concurrency Control and Recovery in Database Systems, by Philip A. Bernstein, Vassos Hadzilacos, and Nathan Goodman.
  • Data Management in the Cloud, Challenges and Opportunities, Divyakant Agrawal, Sudipto Das and Amr El Abbadi