ARTFEED — Contemporary Art Intelligence

Il Campionamento di Potenza con Particelle Ausiliarie Potenzia il Ragionamento degli LLM al Momento dell'Inferenza

ai-technology · 2026-05-06

Una nuova tecnica nota come Auxiliary Particle Power Sampling (APPS) migliora le capacità di ragionamento multi-step dei grandi modelli linguistici (LLM) senza richiedere addestramento aggiuntivo. Questo metodo affronta una limitazione riconosciuta: mentre i LLM di base possono assegnare probabilità significative alle risposte corrette, spesso hanno difficoltà a identificarle efficientemente durante l'inferenza. APPS utilizza un algoritmo a particelle a blocchi per stimare il campionamento di potenza a livello di sequenza, concentrandosi su p_theta(x)^alpha con alpha > 1. Propaga simultaneamente ipotesi utilizzando un ripesaggio di potenza corretto per proposta e migliora la sopravvivenza attraverso una selezione guidata dal valore futuro nei punti di ricampionamento. Questo approccio rialloca le risorse computazionali limitate tra prefissi concorrenti invece di seguire una singola traiettoria. La ricerca, dettagliata nell'articolo su arXiv (2605.02427v1), presenta APPS come un metodo sistematico per guidare la decodifica verso risultati favorevoli.

Fatti principali

  • APPS sta per Auxiliary Particle Power Sampling
  • Si concentra su p_theta(x)^alpha con alpha > 1
  • Utilizza un algoritmo a particelle a blocchi
  • Propaga ipotesi in parallelo
  • Impiega un ripesaggio di potenza corretto per proposta
  • Affina la sopravvivenza tramite selezione guidata dal valore futuro
  • Ridistribuisce il calcolo tra prefissi concorrenti
  • Pubblicato su arXiv con ID 2605.02427v1

Entità

Istituzioni

  • arXiv

Fonti