LLM ottengono la retrosintesi tramite ragionamento ancorato agli atomi

ai-technology · 2026-05-23

Un nuovo framework consente a modelli linguistici di grandi dimensioni (LLM) di uso generale di eseguire la retrosintesi a singolo passaggio senza addestramento specifico per il compito. Il metodo ancora il ragionamento a catena di pensiero alla struttura molecolare utilizzando identificatori atomici unici. In un compito zero-shot, l'LLM identifica i frammenti rilevanti e le etichette chimiche; un passaggio opzionale few-shot utilizza esempi di classe per prevedere la trasformazione. Questo approccio supera le precedenti prestazioni inferiori degli LLM nella retrosintesi, validato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti. Il lavoro affronta la scarsità di dati chimici etichettati sfruttando le capacità di ragionamento degli LLM.

Fatti principali

Il framework utilizza identificatori atomici unici per ancorare il ragionamento.
Opera senza addestramento specifico del modello per il compito.
Processo in due fasi: identificazione zero-shot dei frammenti seguita da previsione opzionale few-shot.
Applicato alla retrosintesi a singolo passaggio, un compito in cui gli LLM avevano prestazioni inferiori in precedenza.
Testato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti.
Affronta la scarsità di dati etichettati in chimica.
Pubblicato su arXiv con ID 2510.16590v2.
Tipo di annuncio: replace-cross.

LLM ottengono la retrosintesi tramite ragionamento ancorato agli atomi

Fatti principali

Entità

Istituzioni

Fonti