WG2Text
Wissensgraph-basierte Textgeneration
Start: 07.2023
Ende: 12.2024
Generative Sprachmodelle erzeugen heute beeindruckende Texte, greifen dabei jedoch häufig auf implizit gelernte, schwer nachvollziehbare und potenziell veraltete Informationen zurück. Besonders bei komplexen Wissensdomänen kann dies zu Faktenfehlern, mangelnder Transparenz und sinkendem Vertrauen führen. WG2Text untersucht, wie explizites Wissen aus semantischen Wissensgraphen für die Textgenerierung nutzbar gemacht werden kann. Ziel ist es, strukturierte, prüfbare und aktualisierbare Informationen aus Wissensgraphen so mit Sprachmodellen zu kombinieren, dass faktenbasierte, verständliche und nachvollziehbare Texte entstehen. Das Projekt entwickelt und vergleicht Ansätze zur Transformation von Wissensgraphen in natürlichsprachliche Texte und demonstriert die Ergebnisse in einem lauffähigen Demonstrator. Damit leistet WG2Text einen Beitrag zu transparenteren und verlässlicheren Sprachmodellen sowie zu einer besseren Wissenskommunikation in unterschiedlichen Anwendungsdomänen
WG2Text erforscht neuro-symbolische Verfahren, die die Stärken generativer Sprachmodelle mit dem expliziten Wissen aus semantischen Wissensgraphen verbinden. Während Sprachmodelle natürlich klingende Texte erzeugen können, sind Wissensgraphen strukturiert, erklärbar, prüfbar und aktualisierbar. Im Projekt werden bestehende Ansätze zur Wissensgraph-zu-Text-Generierung recherchiert, klassifiziert, implementiert und auf Benchmark-Datensätzen evaluiert. Darauf aufbauend werden neue Ansätze entwickelt, die Wissensintegration, Sprachmodellnutzung und Graphrepräsentation modular miteinander verbinden.
Das FZI übernimmt im Projekt als Forschungstransfereinrichtung eine zentrale Rolle bei der Konzeption, Umsetzung, Demonstration und Verwertung der entwickelten Ansätze. Zu den Aufgaben gehören die Analyse des aktuellen Forschungsstands und die Mitgestaltung des Forschungsdesigns. Darüber hinaus beteiligt sich das FZI an der prototypischen Implementierung bestehender Verfahren, an der Entwicklung neuer Komponenten zur Einbindung von Wissen aus Wissensgraphen in Sprachmodelle sowie am Aufbau eines Demonstrator-Systems.