CoRe-Gen: Generazione Robusta da Spettro a Struttura in Condizioni di Impronte Digitali Imperfette
CoRe-Gen, una tecnica innovativa, affronta la difficoltà di determinare le strutture molecolari da spettri di massa tandem (MS/MS) per la generazione de novo che supera i limiti dei database. Questo metodo suddivide il processo in due fasi: prevedere le impronte digitali dagli spettri e poi decodificare le strutture da tali impronte, utilizzando ampi set di dati molecolari. Tuttavia, la sua implementazione dipende da impronte digitali previste anziché ideali, portando a errori strutturati che possono influenzare la generazione. Per migliorare le condizioni intermedie, CoRe-Gen impiega un pre-addestramento su spettri sintetici per l'encoder, affronta il rumore legato all'implementazione con una corruzione delle impronte digitali sensibile alla frequenza durante l'addestramento del decoder e riduce gli errori residui attraverso strategie sensibili alla struttura.
Fatti principali
- CoRe-Gen è un metodo per l'elucidazione della struttura molecolare da spettri di massa tandem.
- Affronta la generazione de novo oltre la copertura del database.
- L'approccio scompone il compito in previsione spettro-impronta digitale e decodifica impronta digitale-struttura.
- L'implementazione si basa su impronte digitali previste, non ideali, causando errori strutturati.
- CoRe-Gen utilizza il pre-addestramento su spettri sintetici dell'encoder.
- Impiega una corruzione delle impronte digitali sensibile alla frequenza durante l'addestramento del decoder.
- Il metodo mitiga gli errori residui utilizzando tecniche sensibili alla struttura.
- L'articolo è disponibile su arXiv con ID 2605.12980.
Entità
Istituzioni
- arXiv