Guida del Classificatore con Calibrazione del Margine per la Pianificazione della Sintesi Guidata dalle Proprietà
Un articolo di ricerca su arXiv (2605.13101) introduce Sequence Completion Ranking (SCR), un metodo innovativo per la pianificazione della sintesi guidata dalle proprietà in chimica. La pianificazione della sintesi comporta la generazione di sequenze di reazione efficienti per produrre molecole target utilizzando modelli di retrosintesi a singolo passo pre-addestrati. Gli autori identificano che i classificatori ausiliari addestrati con la perdita di entropia incrociata non riescono a sovrascrivere le distribuzioni a livello di token provenienti da dataset di reazioni sparsi. SCR utilizza l'argomentazione contrastiva e la perdita basata sul margine per calibrare i classificatori, consentendo una discriminazione significativa durante la decodifica senza riaddestrare il generatore. Questo approccio migliora la soddisfazione dei vincoli e le preferenze dei chimici nella pianificazione delle reazioni.
Fatti principali
- Articolo arXiv 2605.13101
- Metodo Sequence Completion Ranking (SCR)
- Affronta l'insufficienza dei classificatori con entropia incrociata
- Utilizza argomentazione contrastiva e perdita basata sul margine
- Si applica alla pianificazione della sintesi guidata dalle proprietà
- Modelli di retrosintesi a singolo passo
- Nessun riaddestramento del generatore autoregressivo richiesto
- Migliora la soddisfazione dei vincoli nelle sequenze di reazione
Entità
Istituzioni
- arXiv