Abrazando el Poder de los Algoritmos
En la última década, la investigación colaborativa entre químicos, expertos en quimioinformática, ingenieros químicos y científicos de datos ha dado lugar a varios algoritmos capaces de predecir rutas de síntesis completas. Estos avances se han integrado en una variedad de paquetes de software, tanto comerciales como de código abierto, como IBM Rxn for Chemistry, ASKCOS, Chemairs, Synthia, Reaxis y SciFinderN. Estas herramientas ya están fácilmente accesibles para toda la comunidad química. Aunque fueron desarrolladas principalmente para asistir en el desarrollo de fármacos, estas herramientas predictivas también pueden mejorar la selección de rutas comerciales al aumentar la diversidad de ideas.
Una aplicación notable de estos algoritmos fue en la síntesis de Lotiglipron en Pfizer. Utilizando ASKCOS, una herramienta de retrosíntesis desarrollada por el consorcio Machine Learning for Pharmaceutical Discovery and Synthesis (MLPDS), los investigadores incorporaron manualmente rutas prometedoras generadas por el software. ASKCOS permite a los usuarios ingresar una molécula objetivo y genera rutas sintéticas potenciales utilizando modelos de aprendizaje automático entrenados con diversas bases de datos químicas. A pesar de la sofisticación de estas herramientas, a menudo tienen dificultades con transformaciones complejas, como aquellas que implican la formación de heterociclos o la creación de especies quirales deseadas, comunes en aplicaciones farmacéuticas. Como resultado, todavía se requiere un esfuerzo manual significativo para filtrar las sugerencias poco prácticas.
Figure 1: Diversity of routes generated for a single target molecule
En el caso del Lotigliprón, los investigadores propusieron un método de procesamiento paralelo en el que las ideas sintéticas se recopilaban y filtraban por separado antes de fusionarlas con las contribuciones humanas al final de un ciclo. Este enfoque tenía como objetivo mitigar el ruido generado por los algoritmos predictivos, los cuales pueden abrumar la creatividad humana y enmascarar áreas de interés.
El principal desafío para perfeccionar estas herramientas predictivas radica en la calidad de los datos de entrenamiento disponibles. Los conjuntos de datos actuales, que a menudo provienen de cuadernos de laboratorio electrónicos, patentes públicas y fuentes bibliográficas, están sesgados hacia reacciones exitosas. Los investigadores sugieren que utilizar datos de mejor calidad podría mejorar significativamente el rendimiento de los algoritmos.
En este caso, la red integra tanto las ideas generadas por humanos como las generadas por algoritmos, presentadas de una manera que facilita la identificación de rutas de síntesis individuales. Las seis rutas de síntesis propuestas por humanos y las seis generadas por el software se enriquecieron aún más con anotaciones y datos sobre propiedades específicas de cada ruta, lo que permitió la optimización del proceso de selección. Luego, se podían realizar consultas para encontrar la ruta de síntesis más corta desde las moléculas objetivo hasta los materiales de partida, utilizando el algoritmo de Dijkstra, que minimiza el número de pasos involucrados.
Sin embargo, los resultados iniciales destacaron la necesidad de contar con información más completa. Por ejemplo, algunas rutas sugeridas por el algoritmo implicaban materiales de partida que no estaban disponibles comercialmente, lo que las hacía poco prácticas. Esto subraya la importancia de incluir información sobre la disponibilidad y la complejidad de los materiales de partida en los modelos predictivos.
En última instancia, estos esfuerzos representan un avance significativo hacia la integración de la inteligencia artificial con la experiencia humana en la síntesis química. La mejora continua de los algoritmos predictivos, junto con datos de entrenamiento de alta calidad, promete revolucionar la forma en que los químicos abordan la síntesis de moléculas complejas, allanando el camino para procesos de desarrollo de fármacos más eficientes e innovadores.
Nuestra plataforma ofrece una herramienta integral para diseñar rutas sintéticas
Nuestra plataforma puede integrar resultados de las principales herramientas predictivas (dependiendo del plan de suscripción), como IBM Rxn4Chemistry, ASKCOS, Synthia y Chemical.AI, proporcionando una solución integral para la planificación de rutas de síntesis. Al unificar estos algoritmos avanzados, ofrecemos a los usuarios acceso a una amplia variedad de modelos predictivos y rutas de síntesis. Nuestra plataforma destaca en el filtrado de datos, utilizando amplias bases de datos y retroalimentación en tiempo real para refinar las predicciones. Este enfoque reduce significativamente el ruido, garantizando que solo se presenten las rutas más viables e innovadoras. La interfaz de usuario es intuitiva, lo que facilita la visualización y exploración de las rutas, promoviendo una colaboración fluida entre los usuarios.
Figure 2: Data aggregation capabilities possible from RxnHub platform