SciCore-Mol: Framework modulare potenzia i LLM per il ragionamento molecolare
Ecco una novità: SciCore-Mol è un framework innovativo volto a migliorare i grandi modelli linguistici (LLM) aggiungendo componenti cognitive modulari relative alle molecole. Questo approccio collega specifici simboli linguistici con strutture molecolari e dati di reazione. Presenta tre parti interconnesse: un modulo che comprende la topologia, uno che genera molecole utilizzando la diffusione latente e un altro che ragiona sulle reazioni. Questi componenti si collegano al LLM tramite rappresentazioni apprese, consentendo una condivisione di informazioni più profonda oltre al semplice testo. I test su diversi compiti chimici mostrano che SciCore-Mol migliora significativamente sia la comprensione che la generazione molecolare, affrontando le sfide della perdita di informazioni e della semantica poco chiara nel ragionamento scientifico testuale.
Fatti principali
- SciCore-Mol è un framework modulare per potenziare i LLM con moduli di cognizione molecolare.
- Include tre moduli collegabili: percezione topologica, generazione molecolare basata su diffusione latente e ragionamento sulle reazioni.
- I moduli sono accoppiati al backbone del LLM tramite interfacce di rappresentazione apprese.
- Il framework mira a ridurre la perdita di informazioni e il rumore semantico nel ragionamento testuale sulle molecole.
- Gli esperimenti mostrano prestazioni elevate nei compiti di comprensione e generazione molecolare.
- Il lavoro è pubblicato su arXiv con ID 2605.22287.
- L'approccio affronta il divario tra linguaggio discreto e dati molecolari topologici/continui.
- Il framework consente uno scambio di informazioni più ricco rispetto al solo feedback testuale degli strumenti.
Entità
Istituzioni
- arXiv