ARTFEED — Contemporary Art Intelligence

Ottimizzazione Multi-Obiettivo dei Prompt tramite Algoritmi Bandit

ai-technology · 2026-05-16

Un recente articolo su arXiv (2605.14553) presenta un approccio basato sui bandit per selezionare prompt con obiettivi multipli nei grandi modelli linguistici. Questo studio affronta le carenze delle valutazioni basate su un singolo parametro esplorando il recupero di insiemi di prompt di Pareto e l'identificazione di prompt fattibili ottimali. I ricercatori modificano algoritmi efficienti dai bandit multi-obiettivo e introducono un metodo innovativo per identificare il miglior braccio fattibile nei bandit strutturati, fornendo garanzie teoriche per scenari lineari. I risultati sperimentali su vari LLM rivelano miglioramenti notevoli rispetto ai modelli di base.

Fatti principali

  • Articolo arXiv 2605.14553
  • Studia la selezione di prompt multi-obiettivo
  • Due impostazioni: recupero dell'insieme di prompt di Pareto e identificazione del miglior prompt fattibile
  • Utilizza il framework dei bandit a pura esplorazione
  • Nuovo design per l'identificazione del miglior braccio fattibile nei bandit strutturati
  • Garanzie teoriche per il caso lineare
  • Esperimenti su più LLM
  • Gli approcci basati sui bandit producono miglioramenti significativi

Entità

Istituzioni

  • arXiv

Fonti