Maximierung der Kraft der Algorithmen
Im letzten Jahrzehnt hat die kollaborative Forschung zwischen Chemikern, Experten für Chemoinformatik, Chemieingenieuren und Data Scientists verschiedene Algorithmen hervorgebracht, die in der Lage sind, komplette Syntheserouten vorherzusagen. Diese Fortschritte wurden in eine Reihe von Softwarepaketen integriert, sowohl kommerzielle als auch Open-Source-Tools, wie IBM Rxn for Chemistry, ASKCOS, Chemairs, Synthia, Reaxis und SciFinderN. Diese Werkzeuge sind jetzt für die gesamte Chemie-Community leicht zugänglich. Obwohl sie ursprünglich zur Unterstützung der Arzneimittelentwicklung entwickelt wurden, können diese prädiktiven Werkzeuge auch die Auswahl kommerzieller Routen verbessern, indem sie die Vielfalt der Ideen erhöhen.
Eine bemerkenswerte Anwendung dieser Algorithmen war in der Synthese von Lotiglipron bei Pfizer. Mit ASKCOS, einem Retro-Synthese-Tool, das vom Konsortium Machine Learning for Pharmaceutical Discovery and Synthesis (MLPDS) entwickelt wurde, integrierten Forscher manuell vielversprechende Routen, die von der Software generiert wurden. ASKCOS ermöglicht es den Nutzern, ein Zielmolekül einzugeben und potenzielle synthetische Routen zu erzeugen, indem es maschinelle Lernmodelle verwendet, die auf verschiedenen chemischen Datenbanken trainiert wurden. Trotz der Raffinesse dieser Werkzeuge haben sie oft Schwierigkeiten mit komplexen Transformationen, wie denen, die die Bildung von Heterocyclen oder die Erzeugung gewünschter chiraler Spezies betreffen, die in pharmazeutischen Anwendungen häufig vorkommen. Infolgedessen ist immer noch ein erheblicher manueller Aufwand erforderlich, um unpraktische Vorschläge herauszufiltern.
Figure 1: Diversity of routes generated for a single target molecule
Im Fall von Lotiglipron schlugen die Forscher eine Methode der Parallelverarbeitung vor, bei der synthetische Ideen separat gesammelt und gefiltert wurden, bevor sie am Ende eines Brainstorming-Zyklus mit den menschlichen Beiträgen zusammengeführt wurden. Dieser Ansatz hatte zum Ziel, das Rauschen zu mindern, das durch prädiktive Algorithmen erzeugt wird, die die menschliche Kreativität überwältigen und interessante Bereiche verschleiern können.
Die größte Herausforderung bei der Verfeinerung dieser prädiktiven Werkzeuge liegt in der Qualität der verfügbaren Trainingsdaten. Die aktuellen Datensätze, die oft aus elektronischen Laborbüchern, öffentlichen Patenten und Literaturquellen stammen, sind auf erfolgreiche Reaktionen ausgerichtet. Forscher schlagen vor, dass die Verwendung von qualitativ besseren Daten die Leistung der Algorithmen erheblich verbessern könnte.
In diesem Fall integriert das Netzwerk sowohl die von Menschen generierten Ideen als auch die von Algorithmen generierten Ideen, die so präsentiert werden, dass die Identifikation einzelner Syntheserouten erleichtert wird. Die sechs von Menschen vorgeschlagenen Syntheserouten und die sechs vom Software-Algorithmus generierten Routen wurden weiter mit Anmerkungen und Daten zu spezifischen Eigenschaften jeder Route angereichert, was die Optimierung des Auswahlprozesses ermöglichte. Anschließend konnten Abfragen durchgeführt werden, um die kürzeste Syntheseroute von den Zielmolekülen zu den Ausgangsmaterialien zu finden, unter Verwendung des Dijkstra-Algorithmus, der die Anzahl der erforderlichen Schritte minimiert.
Die ersten Ergebnisse hoben jedoch die Notwendigkeit hervor, umfassendere Informationen zu berücksichtigen. Zum Beispiel beinhalteten einige vom Algorithmus vorgeschlagene Routen Ausgangsmaterialien, die kommerziell nicht verfügbar waren, was sie unpraktisch machte. Dies unterstreicht die Bedeutung, Informationen über die Verfügbarkeit und Komplexität der Ausgangsmaterialien in die prädiktiven Modelle einzubeziehen.
Letztendlich stellen diese Bemühungen einen bedeutenden Fortschritt in Richtung der Integration von Künstlicher Intelligenz mit menschlicher Erfahrung in der chemischen Synthese dar. Die kontinuierliche Verbesserung prädiktiver Algorithmen, zusammen mit hochwertigen Trainingsdaten, verspricht, die Art und Weise zu revolutionieren, wie Chemiker die Synthese komplexer Moleküle angehen, und ebnet den Weg für effizientere und innovativere Arzneimittelentwicklungsprozesse.
Unsere Plattform bietet ein umfassendes Werkzeug zur Planung von synthetischen Routen
Unsere Plattform kann Ergebnisse der führenden prädiktiven Tools (je nach Abonnementplan) integrieren, wie IBM Rxn4Chemistry, ASKCOS, Synthia und Chemical.AI, und bietet eine umfassende Lösung für die Planung von Synthesewegen. Durch die Vereinheitlichung dieser fortschrittlichen Algorithmen bieten wir den Nutzern Zugang zu einer breiten Palette prädiktiver Modelle und Synthesewegen. Unsere Plattform zeichnet sich durch eine exzellente Datenfilterung aus, indem sie umfangreiche Datenbanken und Echtzeit-Feedback nutzt, um die Vorhersagen zu verfeinern. Dieser Ansatz reduziert erheblich das Rauschen und stellt sicher, dass nur die vielversprechendsten und innovativsten Wege präsentiert werden. Die Benutzeroberfläche ist intuitiv und erleichtert die Visualisierung und Erkundung der Wege, wodurch eine reibungslose Zusammenarbeit zwischen den Nutzern gefördert wird.
Figure 2: Data aggregation capabilities possible from RxnHub platform