Johanna Kuch M.Sc.

Wissenschaftliche Mitarbeiterin
Lehrstuhl für Menschzentrierte Künstliche Intelligenz
Telefon: +49 821 598 - 2345
E-Mail:
Raum: 2039 (N)
Sprechzeiten: nach Vereinbarung
Adresse: Universitätsstraße 6a, 86159 Augsburg

Themen für Abschlussarbeiten

Folgende Themen betreue ich gerne im Rahmen einer Bachelor- oder Masterarbeit.

Der inhaltliche Schwerpunkt kann dabei angepasst werden, sodass Interessen und Kompetenzen der Studierenden optimal abgedeckt werden.

Auch eigene Themenvorschläge sind willkommen.

 

 

Voice Cloning in einer Webapp

Untersuche, wie synthetische Stimmen direkt im Browser erzeugt und manipuliert werden können. Ziel ist die Entwicklung oder Integration eines Voice-Cloning-Systems in eine existierende Webanwendung mit Fokus auf einfache Nutzbarkeit. Untersucht wird speziell, wie aus bestehenden Stimmen zusätzliche TTS-Varianten generiert und für Endnutzer praktisch zugänglich gemacht werden können.

 

Voice Design mit einem evolutionen Algorithmus und Voice Cloning

In dieser Arbeit soll ein evolutionärer Algorithmus (existiert schon) an geklonte Embeddings (XTTSv2 oder ähnliche) angebunden werden, der die geklonten Stimmen automatisch an Zielkriterien anpasst z. B. Persönlichkeitsmerkmale, Sympathie, .... Durch schrittweise Anpassung durch Nutzende wird dann die Stimme iterativ verbessert. Ziel ist ein interaktives System, das „ideale“ Stimmen für bestimmte Charaktere oder Anwendungen generiert.

 

Kann man Stimmen so gestalten, dass sie bestimmte Persönlichkeitsmerkmale und Attributionen gezielt abbilden?
Evaluation/Erweiterung eines existierenden Design Tools

Diese Arbeit untersucht, wie wahrgenommene Persönlichkeitsmerkmale (z. B. freundlich, kompetent, dominant) gezielt über Stimmparameter beeinflusst werden können. Dazu sollen systematisch Parameter wie Tonhöhe, Sprechtempo oder Timbre variiert und ihre Wirkung auf Hörer*innen empirisch evaluiert werden. Ziel ist es, Gestaltungsrichtlinien für „Voice Personality Design“ zu formulieren. In dieser Arbeit kann auch ein bestehendes Voice-Design-System (z. B. VoiceX) hinsichtlich seiner Nutzbarkeit und Gestaltungswirksamkeit untersucht werden. Neben einer Evaluation der User Experience kann auch eine konzeptionelle oder technische Erweiterung erfolgen, etwa durch neue Kontrollparameter oder interaktive Visualisierungen, um die kreative Arbeit mit synthetischen Stimmen zu erleichtern.

 

Training eines Classifiers zur Erkennung des Voice Genders (m/w/d)
(Evaluation und Einbau in eine Webapp ebenfalls möglich)
Ziel dieser Arbeit ist die Entwicklung und Evaluation eines Machine-Learning-Modells, das zwischen männlichen, weiblichen und gender-ambiguous Stimmen unterscheiden kann. Neben der Trainings- und Testphase kann das Modell in eine Webanwendung integriert und hinsichtlich Fairness, Genauigkeit und Interpretierbarkeit untersucht werden. Für diese Arbeit kann auch ein Datensatz zusammengetragen werden um das Training vorzubereiten.

Suche