ARTFEED — Contemporary Art Intelligence

VQ-SAD: Modello di Diffusione Neuro-Simbolico per la Generazione di Molecole

other · 2026-05-04

Un nuovo metodo chiamato VQ-SAD (Vector Quantized Structure Aware Diffusion) affronta le limitazioni della generazione di molecole basata su diffusione incorporando informazioni simboliche. Gli approcci tradizionali che utilizzano rappresentazioni one-hot o impronte digitali di Morgan soffrono di collisioni di hash e perdita di informazioni. VQ-SAD impiega un VQ-VAE per trattare i codici di atomi e legami come variabili latenti, utilizzando codebook pre-addestrati congelati come tokenizer per il processo di diffusione. Questo modello neuro-simbolico combina informazioni strutturali simboliche e neurali con un processo forward apprendibile. Il grande spazio di codici discreti fornisce tipi bilanciati di atomi e legami, migliorando la denoising. L'articolo è disponibile su arXiv (2605.00354).

Fatti principali

  • VQ-SAD utilizza VQ-VAE per i codici di atomi e legami come variabili latenti
  • I codebook VQ-VAE pre-addestrati congelati fungono da tokenizer
  • Modello neuro-simbolico che combina informazioni simboliche e neurali
  • Processo forward apprendibile nel modello di diffusione
  • Il grande spazio di codici discreti migliora la denoising
  • Affronta le collisioni di hash e la perdita di informazioni nelle impronte digitali di Morgan
  • Articolo pubblicato su arXiv con ID 2605.00354
  • Tipo di annuncio incrociato

Entità

Istituzioni

  • arXiv

Fonti