ARTFEED — Contemporary Art Intelligence

LLM ottengono la retrosintesi tramite ragionamento ancorato agli atomi

ai-technology · 2026-05-23

Un nuovo framework consente a modelli linguistici di grandi dimensioni (LLM) di uso generale di eseguire la retrosintesi a singolo passaggio senza addestramento specifico per il compito. Il metodo ancora il ragionamento a catena di pensiero alla struttura molecolare utilizzando identificatori atomici unici. In un compito zero-shot, l'LLM identifica i frammenti rilevanti e le etichette chimiche; un passaggio opzionale few-shot utilizza esempi di classe per prevedere la trasformazione. Questo approccio supera le precedenti prestazioni inferiori degli LLM nella retrosintesi, validato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti. Il lavoro affronta la scarsità di dati chimici etichettati sfruttando le capacità di ragionamento degli LLM.

Fatti principali

  • Il framework utilizza identificatori atomici unici per ancorare il ragionamento.
  • Opera senza addestramento specifico del modello per il compito.
  • Processo in due fasi: identificazione zero-shot dei frammenti seguita da previsione opzionale few-shot.
  • Applicato alla retrosintesi a singolo passaggio, un compito in cui gli LLM avevano prestazioni inferiori in precedenza.
  • Testato su benchmark accademici e molecole per la scoperta di farmaci validate da esperti.
  • Affronta la scarsità di dati etichettati in chimica.
  • Pubblicato su arXiv con ID 2510.16590v2.
  • Tipo di annuncio: replace-cross.

Entità

Istituzioni

  • arXiv

Fonti