Bachelorarbeit – Dennis Pfeiffer
- Events
- Kolloquium WS25/26
Zusammenfassung (Abstract)
Apps zur Stimmungserfassung (Mood-Tracking) können das Selbstmanagement der psychischen Gesundheit unterstützen, indem sie Nutzenden helfen, ihre emotionalen Zustände zu überwachen und Muster in ihrem täglichen Leben zu identifizieren. Die meisten existierenden Apps konzentrieren sich jedoch auf die Datenerhebung und -visualisierung, bieten aber kaum personalisierte Hilfestellungen. Zudem werfen viele Apps erhebliche Datenschutzbedenken auf, da sie sensible Daten an Drittanbieter weitergeben. Diese Arbeit stellt MoodScape vor, eine reflexive Well-being-App für Android, die kontextbewusstes Mood-Tracking mit personalisierten, von einem Large Language Model (LLM) generierten Empfehlungen kombiniert und dabei die Privatsphäre der Nutzenden durch ein lokal gehostetes Open-Source-Sprachmodell schützt. MoodScape erfasst Stimmungseinträge zusammen mit Kontextsignalen aus Wetter-, Musik-, Gesundheits- und Social-Interaction-APIs und nutzt ein lokal auf einem universitätseigenen Server bereitgestelltes Ollama-Modell (llama3.2:1b), um maßgeschneiderte Empfehlungen zu generieren – ohne Stimmungs- oder Gesundheitsdaten an kommerzielle Cloud-Anbieter zu übermitteln.
Das System wurde in einer zweiwöchigen AB/BA-Crossover-Feldstudie mit zehn Teilnehmenden evaluiert. Jede Testperson durchlief in randomisierter Reihenfolge sowohl eine Bedingung mit maßgeschneiderten Empfehlungen (in der das LLM auf persönliche Stimmungs- und Kontextdaten zurückgriff) als auch eine generische Baseline-Bedingung. Die wahrgenommene Qualität der Empfehlungen, die Systembenutzerfreundlichkeit (SUS), die User Experience (UEQ) und die selbsteingeschätzte Reflexion wurden durch standardisierte Fragebögen erhoben.
Die Ergebnisse zeigen ein konsistentes deskriptives Muster zugunsten der personalisierten Bedingung: Die Teilnehmenden bewerteten die LLM-generierten Empfehlungen in allen vier Vergleichspunkten höher als die Baseline, wobei der größte Unterschied bei der wahrgenommenen Personalisierung lag (M=2,80 gegenüber M=2,00), was in einem ergänzenden Wilcoxon-Vorzeichen-Rang-Test ebenfalls statistische Signifikanz erreichte (p=,039, r=,65). Die absoluten Zufriedenheitswerte blieben jedoch in beiden Bedingungen moderat, und die Nutzung der App variierte stark zwischen den Teilnehmenden (4–38 Stimmungseinträge). MoodScape erreichte eine überdurchschnittliche Usability (M=74,75) sowie positive Werte bei der User Experience, wobei die Nutzenden insbesondere die Funktionen zur Datenexploration schätzten. Die Reflexions-Items deuten darauf hin, dass die App die Datenexploration und in gewissem Maße die Selbstreflexion unterstützte, wenngleich tiefgreifende Verhaltensänderungen innerhalb des Studienzeitraums nicht eintraten.
Diese Ergebnisse zeigen, dass datenschutzfreundliche, lokal gehostete LLMs in einer DSGVO-konformen Architektur technisch geeignet sind, um stimmungsbezogene Empfehlungen zu generieren, und dass der Personalisierungsansatz selbst positiv wahrgenommen wird. Der Qualitätsunterschied zu größeren kommerziellen Modellen schränkte jedoch die praktische Wirkung ein. Da Open-Source-Sprachmodelle kontinuierlich besser werden, bietet der von MoodScape aufgezeigte Ansatz einen vielversprechenden Weg hin zu KI-gestützter Well-being-Unterstützung, die die Privatsphäre der Nutzenden respektiert.
