ARTFEED — Contemporary Art Intelligence

InteractBind: Dataset su larga scala per la localizzazione dei siti di legame proteina-ligando

publication · 2026-05-26

I ricercatori hanno introdotto InteractBind, un dataset su larga scala di circa 100.000 coppie proteina-ligando, progettato per valutare se i modelli sono in grado di localizzare i siti di legame e identificare le interazioni non covalenti. I benchmark esistenti si concentrano sulla previsione binaria del legame e sulla regressione dell'affinità, ma non valutano la comprensione spaziale del riconoscimento molecolare. InteractBind include compiti di localizzazione fine dei siti di legame utilizzando mappe di interazione residuo proteico-atomo di ligando che coprono sei principali tipi di interazioni non covalenti. Il dataset fornisce anche dati di affinità di legame. Questo lavoro colma una lacuna critica nella scoperta computazionale di farmaci e nel design molecolare, consentendo una valutazione più rigorosa dei modelli proteina-ligando.

Fatti principali

  • InteractBind comprende circa 100.000 coppie proteina-ligando.
  • Il dataset include la localizzazione dei siti di legame come compito fine principale.
  • Le mappe di interazione coprono sei principali tipi di interazioni non covalenti.
  • I benchmark esistenti valutano solo il legame binario e la regressione dell'affinità.
  • Il lavoro mira a valutare se i modelli apprendono i siti di legame o solo la probabilità di legame.
  • InteractBind è introdotto come benchmark per la valutazione fine.
  • Il dataset supporta la scoperta computazionale di farmaci e il design molecolare.
  • L'articolo è pubblicato su arXiv con ID 2605.24045.

Entità

Istituzioni

  • arXiv

Fonti