ARTFEED — Contemporary Art Intelligence

ProtLiD²: Diffusione Discreta Condizionata dal Ligando per la Progettazione di Proteine

publication · 2026-05-28

ProtLiD² rappresenta un innovativo modello di diffusione discreta volto alla co-progettazione di sequenze e strutture proteiche con specifici vincoli di ligando. Questo modello genera simultaneamente sequenze di amminoacidi e token strutturali discreti, utilizzando l'attenzione incrociata sensibile alla geometria per integrare sia i dettagli chimici che geometrici dei ligandi. Addestrato su oltre un milione di complessi ligando-proteina, ProtLiD² potenzia la diffusione discreta mascherata, facilitando la progettazione di proteine consapevoli del ligando e colmando una lacuna negli attuali modelli linguistici di proteine a diffusione discreta che mancano di condizionamento diretto da piccole molecole. L'introduzione di questo modello è disponibile in un preprint su arXiv (2605.27413).

Fatti principali

  • ProtLiD² è un modello di diffusione discreta condizionata dal ligando per la co-progettazione sequenza-struttura delle proteine.
  • Genera congiuntamente la sequenza amminoacidica e i token strutturali discreti.
  • Integra informazioni chimiche e geometriche del ligando attraverso l'attenzione incrociata sensibile alla geometria.
  • Addestrato su oltre un milione di complessi ligando-proteina.
  • Estende la diffusione discreta mascherata per la progettazione di proteine consapevoli del ligando.
  • Affronta le limitazioni degli attuali modelli linguistici di proteine a diffusione discreta.
  • Pubblicato come preprint arXiv 2605.27413.
  • Il modello consente la progettazione di proteine con sequenza e struttura compatibili sotto vincoli espliciti del ligando.

Entità

Istituzioni

  • arXiv

Fonti