LLM ottengono la retrosintesi tramite ragionamento ancorato agli atomi
Un nuovo framework consente a modelli linguistici di grandi dimensioni (LLM) di uso generale di eseguire la retrosintesi a singolo passaggio senza addestramento specifico per il compito. Il metodo ancora il ragionamento a catena di pensiero alla struttura molecolare utilizzando identificatori atomici unici. In un compito zero-shot, l'LLM identifica i frammenti rilevanti e le etichette chimiche; un passaggio opzionale few-shot utilizza esempi di classe per prevedere la trasformazione. Questo approccio supera le precedenti prestazioni inferiori degli LLM nella retrosintesi, validato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti. Il lavoro affronta la scarsità di dati chimici etichettati sfruttando le capacità di ragionamento degli LLM.
Fatti principali
- Il framework utilizza identificatori atomici unici per ancorare il ragionamento.
- Opera senza addestramento specifico del modello per il compito.
- Processo in due fasi: identificazione zero-shot dei frammenti seguita da previsione opzionale few-shot.
- Applicato alla retrosintesi a singolo passaggio, un compito in cui gli LLM avevano prestazioni inferiori in precedenza.
- Testato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti.
- Affronta la scarsità di dati etichettati in chimica.
- Pubblicato su arXiv con ID 2510.16590v2.
- Tipo di annuncio: replace-cross.
Entità
Istituzioni
- arXiv