Benchmarking von Methoden zum Lernen von Chemischen Reaktionsnetzwerken aus Zeitreihendaten

Skrzypczak, Glenn (2025) Benchmarking von Methoden zum Lernen von Chemischen Reaktionsnetzwerken aus Zeitreihendaten. Masters thesis, Institute for Visual and Analytic Computing, University of Rostock.

[img] Text
MA_Glenn_Skrzypczak_signed.pdf
Restricted to Registered users only

Download (5MB)

Abstract

Chemical Reaction Networks (CRNs) bilden einen zentralen Formalismus zur Beschreibung komplexer chemischer und biologischer Prozesse. In den letzten Jahren wurden verschiedene Methoden entwickelt, um die Struktur solcher Netzwerke direkt aus Zeitreihendaten zu rekonstruieren. Dennoch fehlt es bislang an standardisierten Evaluationsverfahren, die einen systematischen Vergleich dieser Ansätze ermöglichen. Ziel dieser Arbeit ist es daher, eine umfassende Benchmarking-Studie zum Lernen von CRNs durchzuführen, um aktuelle Methoden hinsichtlich Genauigkeit, Skalierbarkeit und Stabilität zu bewerten. Zur Entwicklung eines konsistenten Bewertungsrahmens wird zunächst eine Literaturrecherche durchgeführt, die bestehende Evaluationspraktiken analysiert. Diese zeigt, dass die meisten Studien nur wenige Testfälle verwenden und etablierte Vergleichsverfahren oft unberücksichtigt bleiben. Aus diesen Erkenntnissen werden Guidelines abgeleitet, um nachvollziehbare und aussagekräftige Bewertungen zu unterstützen. Diese Guidelines bilden auch den Ausgangspunkt für eine anschließend durchgeführte Benchmarking-Studie, die die drei aktuellen Methoden Coupled SINDy, Evolving Libraries und Reactmine in einer Reihe von Testszenarien untersucht. Die Durchführung erfolgt mithilfe einer erweiterten Version des Tools CRNBench, um eine umfassende Dokumentation und Vergleichbarkeit der Ergebnisse sicherzustellen. Die Ergebnisse zeigen, dass Reactmine am häufigsten korrekte Reaktionen identifiziert, aufgrund exponentiell wachsender Laufzeiten jedoch nur für kleinere CRNs geeignet ist. Evolving Libraries skaliert effizienter und erzeugt Netzwerke, die gut zu den Daten passen, erkennt aber seltener korrekte Reaktionen. Coupled SINDy schneidet am schlechtesten ab und weist Leistungschwankungen und eine starke Tendenz zu Overfitting auf. Diese Arbeit leistet mit fundierten Guidelines, einer Erweiterung von CRNBench und einer breiten Vergleichsstudie einen wichtigen Beitrag zum Benchmarking von Methoden zum Lernen von CRNs. Sie liefert außerdem neue Einblicke in die Stärken und Schwächen der untersuchten Verfahren und unterstützt so deren gezielte Weiterentwicklung.

Item Type: Thesis (Masters)