Willkommen bei der Forschungsgruppe für Datenmanagement und -engineering (dme). 


Unsere aktuelle Forschung befasst sich mit dem Entwurf und der Bewertung von Algorithmen für die Integration und Synthese relationaler Daten mit einem besonderen Schwerpunkt auf Schema-Matching und Entity-Matching.

 

Unsere Lehre umfasst sowohl Algorithmen als auch Systeme für Datenmanagement und -verarbeitung. Dazu gehören neben Datenintegration und -synthese auch Dataset Discovery, Data Profiling, Data Cleaning, Data Mining, relationale und nicht-relationale Datenbankmanagementsysteme sowie verteilte Datenverarbeitung und die Verarbeitung von Echtzeitdaten.

Neuigkeiten

Zwei unserer Forschungsarbeiten wurden auf der diesjährigen International Conference on Extending Database Technology (EDBT) angenommen. Beide Forschungsprojekte resultieren aus einer Kooperation mit dem Hasso-Plattner-Institut aus Potsdam.

 

  • PRISMA: A Privacy-Preserving Schema Matcher using Functional Dependencies. Um Datenquellen integrieren zu können, müssen zunächst Korrespondenzen zwischen ihren Schemata identifiziert werden. Eine solche Identifizierung erweist sich als schwierig, wenn die zu vergleichenden Datenquellen unterschiedlich kodiert sind (z. B. unterschiedliche Sprachen oder verschiedene Verschlüsselungen). In dieser Arbeit stellen wir mit Prisma einen neuen kodierungsunabhängigen Schema Matcher vor, der funktionale Abhängigkeiten innerhalb der einzelnen Datenquellen verwendet um diese abzugleichen.
     
  • Icewafl: A Configurable Data Stream Polluter. Das Benchmarking von Data Engineering Algorithmen erfordert geeignete Testdaten. In vielen Fällen spielen Datenfehler dabei eine große Rolle (z. B. um die Effektivität von Algorithmen zur Erkennung solcher Fehler oder der Robustheit von datenverarbeitenden Algorithmen gegenüber solcher Fehler zu evaluieren). In diesem Papier stellen wir einen neuen Ansatz zur Verschmutzung von Datenströmen vor.

Suche