Il Framework AdaExplore Consente l'Auto-Miglioramento degli LLM per la Generazione di Codice Kernel
AdaExplore è un framework innovativo progettato per superare le carenze degli agenti basati su modelli linguistici di grandi dimensioni nella generazione di codice kernel critico per le prestazioni. I metodi esistenti spesso gestiscono ogni istanza del problema in isolamento, senza costruire su conoscenze riutilizzabili, il che è particolarmente impegnativo per linguaggi specifici di dominio come Triton, che mancano di rappresentazione nei dataset di pre-addestramento degli LLM. Questi linguaggi impongono vincoli rigorosi e presentano paesaggi di ottimizzazione complessi, rendendo inaffidabili la generazione diretta e l'affinamento locale. AdaExplore facilita l'auto-miglioramento attraverso feedback di esecuzione accumulato in due fasi: adattamento guidato dai fallimenti e ricerca che preserva la diversità. Questa strategia combinata migliora sia la correttezza che le prestazioni di ottimizzazione senza necessitare di ulteriore fine-tuning o informazioni esterne. Il framework è stato delineato in un documento di ricerca su arXiv, identificato come 2604.16625v1, e si concentra sulla generazione di codice kernel critico per le prestazioni, un'area in cui un solido auto-miglioramento deve ancora essere risolto.
Fatti principali
- AdaExplore è un framework agente per la generazione di codice kernel
- Utilizza adattamento guidato dai fallimenti e ricerca che preserva la diversità
- Il framework migliora la correttezza e le prestazioni di ottimizzazione
- Funziona senza ulteriore fine-tuning o conoscenze esterne
- Si rivolge a linguaggi specifici di dominio come Triton
- Affronta le limitazioni negli approcci LLM attuali
- Ricerca pubblicata su arXiv con identificatore 2604.16625v1
- Il tipo di annuncio è cross
Entità
Istituzioni
- arXiv