SmartSOP
KI-gestützte Frameworks zur intelligenten SOP-Erzeugung
Start: 03.2026
Ende: 02.2028
SmartSOP entwickelt ein KI-gestütztes Framework, mit dem Standardarbeitsanweisungen, sogenannte SOPs, aus wissenschaftlich-technischen Quellen automatisiert erzeugt, strukturiert, validiert und nachvollziehbar dokumentiert werden können. Ziel ist es, unstrukturierte Fachtexte, Normen, Methodenbeschreibungen und Applikationsdokumente in maschinenlesbare, auditierbare SOP-Strukturen zu überführen. Damit adressiert das Projekt ein zentrales Digitalisierungsdefizit in regulierten Labor- und Qualitätsprozessen: SOPs liegen heute häufig als statische PDF-, Word- oder LIMS-Dokumente vor, sind nur begrenzt interoperabel und müssen mit hohem manuellem Aufwand gepflegt werden. SmartSOP verbindet domänenspezifische Large Language Models, Retrieval-Augmented Generation, semantische Segmentierung, Ontologien, Validierungsregeln und Traceability-Mechanismen zu einer durchgängigen Toolchain. Die entstehenden SOPs sollen für Menschen verständlich und zugleich für Maschinen verarbeitbar sein. Dadurch können Laborprozesse transparenter, reproduzierbarer und anschlussfähiger an digitale Qualitätsmanagement-, Labor- und Gerätesysteme werden.
Im Projekt SmartSOP entwickeln Angi GmbH, IUTA e. V. und das FZI gemeinsam ein modulares Software-Framework für die intelligente Erzeugung und Nutzung von SOPs. Ausgangspunkt ist die Beobachtung, dass Analysemethoden in wissenschaftlichen Publikationen, Normen, Herstellerdokumentationen und internen Laborunterlagen zwar in großer Zahl verfügbar sind, aber selten in einer Form vorliegen, die direkt wiederverwendbar, maschinenlesbar oder auditierbar ist. SmartSOP schafft hierfür einen neuen technischen Ansatz: Relevante Textquellen werden gesammelt, vorverarbeitet, semantisch segmentiert und mithilfe domänenspezifisch angepasster KI-Modelle in strukturierte SOP-Bausteine überführt. Diese Bausteine werden anschließend gegen ein generisches SOP-Datenmodell validiert, mit Metadaten, Quellenverweisen und Confidence-Werten angereichert und in standardisierten Formaten wie JSON oder XML bereitgestellt. Im Fokus steht zunächst die Flüssigkeitschromatographie mit Massenspektrometrie. Die modulare Architektur soll jedoch auf weitere analytische Verfahren übertragbar sein. Ergänzend entstehen Mechanismen zur Versionskontrolle, Änderungsverfolgung, Audit-Trail-Erzeugung und Workflow-Automatisierung. Das Ergebnis ist ein prototypisches End-to-End-System, das von der Literatur- und Methodenquelle bis zur validierbaren, maschinenkompatiblen SOP reicht.
Das FZI verantwortet im Projekt die KI-basierte Interpretation, Generierung, Validierung und Pflege maschinenlesbarer SOPs. Im Mittelpunkt steht die Entwicklung eines KI-Backends, das SOP-relevante Informationen aus heterogenen Fachquellen erkennt, semantisch strukturiert und in das gemeinsame SOP-Datenmodell überführt. Dazu passt das FZI Open-Weight-Sprachmodelle mit In-Context-Learning, Prompting-Strategien und gegebenenfalls LoRA-/QLoRA-Fine-Tuning an die Labor- und SOP-Domäne an. Ergänzend wird Retrieval-Augmented Generation eingesetzt, um die Generierung an versionierte und geprüfte Wissensquellen zu binden und Halluzinationen zu reduzieren. Ein weiterer Schwerpunkt ist die Entwicklung von Confidence-Scoring-Verfahren, etwa über Logits, Probes, Self-Consistency- oder Cross-Model-Checks. Das FZI entwickelt außerdem Mechanismen zum semantischen Vergleich unterschiedlicher SOP-Versionen und zur automatisierten Erweiterung von Audit-Trail-Einträgen. In späteren Arbeitspaketen integriert das FZI die KI-Komponenten in eine robuste API-Schicht, unterstützt die Generierung standardisierter Labor-Workflows und optimiert die semantischen Workflows anhand der internen Labor- und Integrationstests.