Support
projects.back_to_database

Automatisierte Fragebogenauswertung mit Generativer KI

Die Initiative Babylotse Frankfurt führt regelmäßig Umfragen unter Familien mit Babys durch, um deren Bedürfnisse und Anliegen zu ermitteln. Bei der für dieses Projekt durchgeführten Umfrage gingen ca. 1000 Antworten ein. Die manuelle Auswertung der Antworten wäre jedoch aufgrund des offenen Antwortformats sehr zeitaufwendig und komplex gewesen. Da die Daten anonym vorlagen, hat Babylotse Frankfurt die Zusammenarbeit mit CorrelAid e.V. gesucht, um die Daten mithilfe von Large Language Models (LLM, zu Deutsch: große Sprachmodelle) automatisiert auszuwerten. Diese Technologie ermöglichte eine schnelle Identifizierung übergeordneter Kategorien und die Zuordnung der Antworten, sodass sowohl die häufigsten positiven als auch negativen Aspekte für ganz Frankfurt sowie heruntergebrochen auf regionaler Ebene detailliert schriftlich erfasst wurden. Die Ergebnisse wurden den städtischen Entscheidungsträgern vorgestellt und Babylotse Frankfurt beabsichtigt, die erfolgreiche Partnerschaft mit CorrelAid e.V. fortzusetzen und die Umfrage zu wiederholen.

reporting survey

Die Challenge

Babylotse Frankfurt legt großen Wert auf Familienfreundlichkeit. Um fundierte Informationen über den aktuellen Stand und Verbesserungspotenziale in dieser Hinsicht zu gewinnen, wurde eine Umfrage durchgeführt. Diese fand sowohl online als auch in Papierform bei ausgewählten Veranstaltungen statt. Die gesammelten Daten sind aufgrund der offenen Fragestellungen teils unstrukturiert und enthalten auch Spam-Antworten. Daher sucht Babylotse Frankfurt Unterstützung bei der Auswertung der Daten. Ziel ist es, die wichtigsten Stärken (“Tops”) und Schwächen (“Flops”) zu identifizieren und diese gegebenenfalls nach Stadtteilen zu gliedern. Auf diese Weise möchte Babylotse den politischen Vertreter*innen eine klare und prägnante Botschaft übermitteln, um die Familienfreundlichkeit in Frankfurt zu verbessern.

Datengrundlage und Datenstruktur

Alle Umfrageantworten wurden in eine gemeinsame Excel-Tabelle überführt. Die Umfrage bestand im Wesentlichen aus drei Fragen: “Ich wohne im Stadtteil”, “Das gefällt mir gut mit Baby in Frankfurt”, sowie “Das gefällt mir nicht gut mit Baby in Frankfurt”. Es gab keine Vorgaben bei der Beantwortung der Fragen, so dass die Antworten sich in Länge, Struktur und Stil sehr stark unterscheiden. Insgesamt konnten ca. 1000 Antworten gesammelt werden. Davon waren etwa 10% Spam-Antworten.

Der Lösungsansatz

Bild mit vier Kacheln: 1. Find categories, 2. Improve categories, 3. classify comments, 4. analyse comments; unter den 4 Kacheln steht

Das vorliegende Projekt wurde vollständig unter Verwendung generativer KI, insbesondere großer Sprachmodelle (Large Language Models), umgesetzt. Zunächst kam das Sprachmodell zum Einsatz, um allgemeine Kategorien aus den Umfrageantworten zu identifizieren. In einem zweiten Schritt wurden diese Kategorien weiter verfeinert und überarbeitet. Die endgültigen Kategorien wurden in Zusammenarbeit mit Babylotse Frankfurt festgelegt und dienten anschließend dazu, alle Umfrageantworten systematisch zu klassifizieren. Bei der Klassifizierung ordnete das Sprachmodell jede Antwort einer oder mehreren Kategorien zu. Konnten keine ausreichenden Zuordnungen getroffen werden, erhielt die Antwort die Kategorie “Unbekannt”.

Im letzten Schritt wurden die klassifizierten Umfrageantworten analysiert, um die häufigsten Nennungen sowohl insgesamt als auch auf regionaler Ebene zu ermitteln. Auch hierbei kam das Sprachmodell zum Einsatz, um aus den drei häufigsten Kategorien die zentralen Themen herauszufiltern. Diese Analyse machte die Kategorien greifbarer und bot die Grundlage für spezifische Handlungsfelder. Die gesamte Projektarbeit wurde unter Verwendung der Programmiersprache Python und einer API für den Zugriff auf große Sprachmodelle (OpenAI) realisiert. Die Ergebnisse wurden in einem Abschlussbericht für Babylotse Frankfurt aggregiert und zusammengefasst.

Die Wirkung

Die Auswertung hat Babylotse Frankfurt entscheidend dabei unterstützt, die Ergebnisse rechtzeitig für den Termin mit den städtischen Entscheidungsträgern zur Verfügung zu stellen. Durch die starke Reduzierung der manuellen Auswertungsprozesse und den hohen Automatisierungsgrad konnten die vorhandenen Ressourcen verstärkt auf die Interpretation der ermittelten Kategorien sowie die Vorbereitung der Präsentation gerichtet werden.

Der Termin mit den städtischen Entscheidungsträgern war ein eindeutiger Erfolg. Die Ergebnisse wurden klar und verständlich präsentiert und eindeutige Handlungsfelder benannt. Die Analyse offenbarte, dass die Umfrageteilnehmenden insbesondere in den Bereichen Kinderbetreuung, Transport und Barrierefreiheit sowie Familienfreundlichkeit in der Öffentlichkeit negative Erfahrungen gemacht haben und sich umfassende Veränderungen wünschen. Diese Erkenntnisse waren besonders überraschend für die Entscheidungsträger, da in jüngster Vergangenheit bereits Maßnahmen zur Verbesserung der Kinderbetreuung ergriffen wurden. Es scheint, dass diese Maßnahmen noch nicht bei den Umfrageteilnehmenden wirkungsvoll angekommen sind.

Ursprünglich war die Umfrage als einmalige Maßnahme geplant. Dank der erfolgreichen Nutzung generativer KI und großer Sprachmodelle, sowie der Kooperation mit CorrelAid e.V., strebt Babylotse Frankfurt, vorbehaltlich der Bewilligung der finanziellen Mittel, die Wiederholung dieser Umfrage an, um sie möglicherweise zu einem dauerhaften Monitoring auszubauen. CorrelAid e.V. hat bereits wertvolle Hinweise gegeben und nächste Schritte sowie mögliche Anpassungen des Fragebogens aufgezeigt, um dieses Ziel zu erreichen.

projects.labels.sdg_plural

Reduced Inequalities

Reduced Inequalities

Reduce inequality within and among countries.

Gender Equality

Gender Equality

Achieve gender equality and empower all women and girls.

Sustainable Cities and Communities

Sustainable Cities and Communities

Make cities and human settlements inclusive, safe, resilient and sustainable.