Forschungsprojekte

streamFind
Flexible Datenanalyse und Workflow-Designer zur Identifizierung von Chemikalien im Wasserkreislauf
Start: 09.2022
Ende: 08.2025

Das Projekt streamFind entwickelt eine offene, flexible und erweiterbare Softwareplattform für die datengetriebene Identifizierung von Chemikalien im Wasserkreislauf. Im Fokus steht das Non-Target-Screening mit hochauflösender Massenspektrometrie, mit dem auch unbekannte oder bislang nicht regulierte Stoffe, Transformationsprodukte und Chemikalien von wachsender Besorgnis in Wasserproben erkannt und bewertet werden können. Bislang ist die Auswertung solcher Daten komplex, häufig von proprietären Softwarelösungen abhängig und nur mit hohem datenwissenschaftlichem Spezialwissen möglich. streamFind setzt hier an: Die Plattform soll Fachanwenderinnen und Fachanwendern aus Wasseranalytik, Umwelttechnik und Forschung ermöglichen, modulare Workflows grafisch zusammenzustellen, Massenspektrometrie-Daten herstellerübergreifend zu verarbeiten, Metadaten einzubeziehen und Ergebnisse vergleichbar zu dokumentieren. Damit stärkt das Projekt die Datenkompetenzen des wissenschaftlichen Nachwuchses und schafft eine Grundlage, um Schadstoffeinträge in Wasser, Abwasser, Grundwasser und Trinkwasser künftig schneller, transparenter und reproduzierbarer zu untersuchen.
Im Projekt bündeln IUTA und das FZI Forschungszentrum Informatik ihre komplementären Kompetenzen aus Umweltanalytik, Massenspektrometrie, Datenverarbeitung, Softwarearchitektur und Künstlicher Intelligenz. Entwickelt wird eine modulare Open-Source-Plattform, mit der NTS-Workflows für verschiedene Fragestellungen im Wasserkreislauf erstellt, angepasst, ausgeführt und geteilt werden können. Dazu gehören Basis-Module für Datenimport, Peak-Auswahl, Peak-Alignment, Gruppierung, Qualitätsbewertung und Datenqualitätskontrolle. Ergänzend entstehen erweiterte Module, etwa für Datenfilter, Matrixkorrektur, projektübergreifenden Datenabgleich, PCA-DA, Priorisierung relevanter Peaks sowie Identifizierung priorisierter Signale. Ein zentrales Element ist die Einbindung von Metadaten wie Probenahmeort, Zeitpunkt, Umweltparametern oder Betriebsdaten von Aufbereitungsprozessen. So sollen NTS-Ergebnisse besser interpretiert und mit zeitlichen, räumlichen oder prozesstechnischen Informationen verknüpft werden. Die Plattform wird durch Dokumentationen, Tutorials, Fallbeispiele und Workshops begleitet, damit sie auch über das Projektende hinaus durch die wissenschaftliche Community genutzt und erweitert werden kann.
Rolle des FZI
Das FZI bringt im Projekt streamFind seine datenwissenschaftliche und softwaretechnische Expertise ein und verantwortet insbesondere die Konzeption und Umsetzung der digitalen Plattform. Ziel ist es, die komplexe Auswertung von Non-Target-Screening-Daten aus der Wasser- und Umweltanalytik für Fachanwenderinnen und Fachanwender zugänglicher, reproduzierbarer und erweiterbarer zu machen. Dafür entwickelt das FZI die technische Architektur, die Infrastruktur zur Verarbeitung und Integration von Massenspektrometrie- und Metadaten sowie ein grafisches Frontend, über das modulare Analyse-Workflows ohne tiefgehende Programmierkenntnisse erstellt werden können.

Ein weiterer Schwerpunkt des FZI liegt auf der Definition robuster Schnittstellen, Datenformate und Ausführungsmechanismen, damit unterschiedliche Analysebausteine, Programmiersprachen und Datenquellen in einer gemeinsamen Plattform zusammengeführt werden können. Darüber hinaus unterstützt das FZI die Integration datenwissenschaftlicher Methoden, etwa für statistische Analysen, Priorisierung, Visualisierung und Berichtserstellung. Damit schafft das FZI die informatische Grundlage dafür, dass neue Module auch nach Projektende von der wissenschaftlichen Community ergänzt und weiterentwickelt werden können.

Gemeinsam mit IUTA begleitet das FZI die Validierung, Dokumentation und Verbreitung der Plattform. Dabei trägt es dazu bei, die Projektergebnisse als offene, nachvollziehbare und nachhaltig nutzbare Softwarelösung bereitzustellen und den Wissenstransfer zwischen Informatik, Umweltanalytik und Wasserwirtschaft zu stärken.

Ansprechperson
Abteilungsleiter
Bereich: Information Process Engineering
Hauptsitz Karlsruhe

Forschungsschwerpunkte
Angewandte Künstliche Intelligenz

KI aus der Forschung in die Praxis: Wir treiben angewandte KI für Wirtschaft und Mittelstand voran und verbinden dabei Technologie mit Recht und Ethik.

Sicherheit und Resilienz

Sicherheit und Resilienz für die digitale Zukunft: Wir stärken mit unserer Forschung Cybersecurity, Safety und Datenschutz für Wirtschaft und Verwaltung.

Energie und Nachhaltigkeit

Nachhaltigkeit und Praxisnähe zählen: Wir entwickeln IT-Innovationen für Unternehmen, die zu einer klimafreundlichen und ressourceneffizienten Wirtschaft beitragen.

Digitale Gesellschaft

Mit Expertise in angewandter KI, Computational Social Science und Medizintechnik schaffen wir Lösungen für Politik, Wirtschaft und Zivilgesellschaft.

Förderhinweis:
Bundesministerium für Bildung und Forschung, Fördermaßnahme „Digitaler Wandel in Bildung, Wissenschaft und Forschung“, Förderbereich „Stärkung der Datenkompetenzen des wissenschaftlichen Nachwuchses“

Go to Top