SLAPMAN
Streaming LAnguage Processing in MANufacturing
Start: 07.2020
Ende: 06.2021
Textuelle und semi-strukturierte Daten werden in der Produktion häufig unterschätzt, obwohl sie wichtige Hinweise auf Produkt- und Prozessqualität liefern. Maschinenzustände, Fehlermeldungen, Logdaten oder Produktionspläne enthalten wertvolles Wissen, das Fachkräfte bei der frühzeitigen Erkennung von Anomalien, Ausfällen oder Qualitätsabweichungen unterstützen kann. SLAPMAN entwickelt dafür skalierbare Sprachverarbeitungs- und Textanalyse-Module für industrielle Streaming-Daten. Die Komponenten werden als wiederverwendbare Microservices umgesetzt und in Apache StreamPipes integriert, eine Open-Source-IIoT-Toolbox für Self-Service-Analytics. Ziel ist es, Domänenexpertinnen und -experten ohne tiefgehende Programmierkenntnisse in die Lage zu versetzen, sprachbasierte Analysebausteine grafisch zu kombinieren und Qualitätsmuster in laufenden Produktionsdaten zu erkennen. Die Ergebnisse werden als Open Source bereitgestellt und für die European Language Grid-Infrastruktur nutzbar gemacht.
SLAPMAN entwickelt und integriert Streaming-Language-Technology-Module zur Verarbeitung, Analyse und Nutzung unstrukturierter oder semi-strukturierter Prozessdaten aus der Fertigung. Dazu gehören Adapter für textuelle Datenquellen, beispielsweise Produktionspläne aus MES-Systemen, Maschinenstatusdaten oder Fehlerlogs, sowie Pipeline-Elemente für Natural Language Processing. Vorgesehen sind unter anderem Tokenisierung, Sprachdetektion, domänenspezifische Named Entity Recognition, Word Embeddings, Übersetzung und Anreicherung natürlicher Spracheingaben. Ein besonderer Fokus liegt auf einer Lernkomponente, die vorhandene Modelle mithilfe von Few-Shot-Learning schnell an neue Anlagen, Prozesse oder domänenspezifische Textbestände anpassen kann. Die Komponenten werden als eigenständige Microservices umgesetzt, in Apache StreamPipes als Plugins verfügbar gemacht und über eine grafische Oberfläche zu Analysepipelines kombinierbar. Für die Integration in das European Language Grid werden die Module cloud-nativ, Kubernetes-kompatibel und über Helm Charts bereitgestellt.
Im Projekt nutzt das FZI seine Expertise in Stream Processing, Datenmanagement, Knowledge Engineering und maschinellem Lernen. Da Apache StreamPipes ursprünglich am FZI entwickelt wurde, kann das FZI insbesondere die Erweiterung der Plattform um Sprachverarbeitungsfunktionen für industrielle Anwendungsfälle, leicht umsetzen. Zu den Aufgaben gehören die Anforderungsanalyse mit der ELG-Community, die Entwicklung von Adaptern für industrielle Text- und Logdaten, die Umsetzung von NLP-Microservices, die Entwicklung der domänenspezifischen Lernkomponente sowie die Integration der Ergebnisse in Apache StreamPipes und in die ELG-Infrastruktur.
