Analyzing Massive Data Sets
Übersicht
Veranstaltungsart: Vorlesung + Übung (Master)
Credits: 4 + 2 SWS, 8 LP
Turnus: Jedes Sommersemester (nicht im SoSe 2022!)
Empfohlenes Semester:
Master
Master
Prüfung: Schriftliche Klausur
Sprache: Englisch
Inhalte
Die Vorlesung behandelt Konzepte und Methoden, Verfahren, Techniken und Technologien zur Analyse von massiv großen Datensätzen. Mögliche Inhalte umfassen:
- Infrastrukturen für verteilte und parallele Berechnung (z.B. MapReduce, Spark)
- Ähnlichkeitssuche und Clustering
- Analyse von Datenströmen und temporalen Daten
- Webgraphen: Linkanalyse und soziale Netzwerke
- Dynamische Netzwerke und Informationsausbreitung
- Grundlagen des Information Retrieval
- Empfehlungssysteme und Onlinewerbung
Übungen
- Es werden wöchentlich Übungsgruppen zum Stoff der Vorlesung abgehalten
- Keine Übungsblattabgabe, keine Korrektur
- Zwei Arten von Übungsaufgaben:
- Hausaufgaben (Lösung von Studenten zu Hause, keine Besprechung in der Übung)
- Präsenzaufgaben (Lösung von Studenten in der Übung, Besprechung der Aufgabe)
- Lösungsvorschläge gibt es nur für Hausaufgaben
Literatur
- Mining of Massive Datasets. J. Leskovec, A. Rajaraman, J.D. Ullman. Cambridge UniversityPress, 2014
- D. Easley, J. Kleinberg.Networks, Crowds, and Markets: Reasoning About a Highly Connected World.Cambridge University Press, 2010.
- R. Baeza-Yates, B. Ribeiro-Neto: Modern Information Retrieval