Analyzing Massive Data Sets

Übersicht
Veranstaltungsart: Vorlesung + Übung (Master)
Credits: 4 + 2 SWS, 8 LP
Turnus: Jedes Sommersemester (nicht im SoSe 2022!)
Empfohlenes Semester:
Master
Prüfung: Schriftliche Klausur
Sprache: Englisch

Inhalte

 

Die Vorlesung behandelt Konzepte und Methoden, Verfahren, Techniken und Technologien zur Analyse von massiv großen Datensätzen. Mögliche Inhalte umfassen:

 

  • Infrastrukturen für verteilte und parallele Berechnung (z.B. MapReduce, Spark)
  • Ähnlichkeitssuche und Clustering
  • Analyse von Datenströmen und temporalen Daten
  • Webgraphen: Linkanalyse und soziale Netzwerke
  • Dynamische Netzwerke und Informationsausbreitung
  • Grundlagen des Information Retrieval
  • Empfehlungssysteme und Onlinewerbung

 

Übungen

  • Es werden wöchentlich Übungsgruppen zum Stoff der Vorlesung abgehalten
  • Keine Übungsblattabgabe, keine Korrektur
  • Zwei Arten von Übungsaufgaben:
    • Hausaufgaben (Lösung von Studenten zu Hause, keine Besprechung in der Übung)
    • Präsenzaufgaben (Lösung von Studenten in der Übung, Besprechung der Aufgabe)
  • Lösungsvorschläge gibt es nur für Hausaufgaben

Literatur

  • Mining of Massive Datasets. J. Leskovec, A. Rajaraman, J.D. Ullman. Cambridge UniversityPress, 2014
  • D. Easley, J. Kleinberg.Networks, Crowds, and Markets: Reasoning About a Highly Connected World.Cambridge University Press, 2010.
  • R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval

 

 

Suche