Un unico sistema LLM ottimizza il testo in sei diversi domini
L'innovativo sistema di intelligenza artificiale 'optimize_anything' stabilisce nuovi parametri di riferimento in sei diversi compiti di ottimizzazione ridefinendo i problemi come miglioramenti di un artefatto testuale valutato tramite una funzione di punteggio. Supporta sia la ricerca a compito singolo che quella multi-compito, consentendo il trasferimento tra problemi e la generalizzazione a nuovi input. Questo sistema aumenta significativamente l'accuratezza di Gemini Flash su ARC-AGI, passando dal 32,5% all'89,5%. Inoltre, scopre algoritmi di scheduling che riducono i costi cloud del 40%, produce kernel CUDA con un tasso di successo dell'87% rispetto a PyTorch e supera la soluzione di circle packing di AlphaEvolve per n=26. Studi in tre domini rivelano che l'incorporazione di informazioni collaterali utilizzabili porta a una convergenza più rapida e punteggi finali superiori rispetto al feedback basato solo sul punteggio, mentre la ricerca multi-compito si dimostra più efficace dell'ottimizzazione indipendente.
Fatti principali
- Un sistema di ottimizzazione basato su un singolo LLM eguaglia strumenti specializzati in sei domini
- Supporta la ricerca a compito singolo, la ricerca multi-compito con trasferimento tra problemi e la generalizzazione a input non visti
- Triplica l'accuratezza di Gemini Flash su ARC-AGI dal 32,5% all'89,5%
- Trova algoritmi di scheduling che riducono i costi cloud del 40%
- Genera kernel CUDA dove l'87% eguaglia o supera PyTorch
- Supera la soluzione di circle packing riportata da AlphaEvolve per n=26
- Le informazioni collaterali utilizzabili portano a una convergenza più rapida e punteggi finali più alti rispetto al feedback basato solo sul punteggio
- La ricerca multi-compito supera l'ottimizzazione indipendente
Entità
Istituzioni
- arXiv
- Gemini
- AlphaEvolve
- PyTorch