ProtLiD²: Diffusione Discreta Condizionata dal Ligando per la Progettazione di Proteine
ProtLiD² rappresenta un innovativo modello di diffusione discreta volto alla co-progettazione di sequenze e strutture proteiche con specifici vincoli di ligando. Questo modello genera simultaneamente sequenze di amminoacidi e token strutturali discreti, utilizzando l'attenzione incrociata sensibile alla geometria per integrare sia i dettagli chimici che geometrici dei ligandi. Addestrato su oltre un milione di complessi ligando-proteina, ProtLiD² potenzia la diffusione discreta mascherata, facilitando la progettazione di proteine consapevoli del ligando e colmando una lacuna negli attuali modelli linguistici di proteine a diffusione discreta che mancano di condizionamento diretto da piccole molecole. L'introduzione di questo modello è disponibile in un preprint su arXiv (2605.27413).
Fatti principali
- ProtLiD² è un modello di diffusione discreta condizionata dal ligando per la co-progettazione sequenza-struttura delle proteine.
- Genera congiuntamente la sequenza amminoacidica e i token strutturali discreti.
- Integra informazioni chimiche e geometriche del ligando attraverso l'attenzione incrociata sensibile alla geometria.
- Addestrato su oltre un milione di complessi ligando-proteina.
- Estende la diffusione discreta mascherata per la progettazione di proteine consapevoli del ligando.
- Affronta le limitazioni degli attuali modelli linguistici di proteine a diffusione discreta.
- Pubblicato come preprint arXiv 2605.27413.
- Il modello consente la progettazione di proteine con sequenza e struttura compatibili sotto vincoli espliciti del ligando.
Entità
Istituzioni
- arXiv