LLM4Branch: l'IA automatizza la scoperta di strategie di branching per risolutori MILP
Un team di ricercatori ha introdotto LLM4Branch, un framework che sfrutta i modelli linguistici di grandi dimensioni (LLM) per semplificare l'identificazione di strategie di branching efficaci per risolutori di programmazione lineare intera mista (MILP). A differenza delle strategie di branching convenzionali che dipendono da euristiche progettate manualmente, gli attuali approcci di apprendimento automatico richiedono costose dimostrazioni di esperti e spesso subiscono un disallineamento tra i risultati dell'addestramento e l'efficienza del risolutore. LLM4Branch crea un framework di programma eseguibile tramite un LLM e ottimizza un vettore di parametri utilizzando una tecnica di ordine zero, incorporando feedback sulle prestazioni end-to-end. I test condotti su benchmark MILP standard indicano che raggiunge prestazioni all'avanguardia.
Fatti principali
- LLM4Branch utilizza modelli linguistici di grandi dimensioni per scoprire politiche di branching.
- La politica è un programma eseguibile con uno scheletro di programma da un LLM e un vettore di parametri.
- I parametri sono ottimizzati tramite un metodo di ordine zero utilizzando feedback sulle prestazioni end-to-end.
- L'approccio evita la dipendenza da costose dimostrazioni di esperti.
- Gli esperimenti su benchmark MILP standard mostrano prestazioni all'avanguardia.
Entità
—