La decomposizione 2.5-D aumenta la precisione nella costruzione spaziale degli LLM al 94,6%
Un nuovo approccio neuro-simbolico noto come decomposizione 2.5-D migliora le prestazioni dei grandi modelli linguistici (LLM) nei compiti di costruzione spaziale. Questa tecnica, descritta in arXiv:2605.07066, divide la pianificazione in un piano orizzontale bidimensionale gestito dall'LLM, mentre un esecutore deterministico calcola i posizionamenti verticali in base all'occupazione delle colonne. Questo metodo affronta i comuni errori di coordinate nei posizionamenti di blocchi 3D derivanti da istruzioni in linguaggio naturale. Nel benchmark Build What I Mean (160 round), GPT-4o-mini che utilizza questa pipeline ha raggiunto una precisione strutturale media del 94,6% in 12 prove indipendenti, a soli 3,0 punti percentuali dal limite del 97,6% imposto dagli errori dell'agente architetto. Questo risultato supera il 90,3% di GPT-4o e il 76,3% del miglior concorrente. Uno studio di ablazione controllata ha rivelato che la decomposizione 2.5-D ha contribuito per il 50,7% al miglioramento, consentendo ai sistemi autonomi di costruire strutture a partire da istruzioni in linguaggio naturale con un ragionamento spaziale affidabile.
Fatti principali
- arXiv:2605.07066 introduce la decomposizione 2.5-D per la costruzione spaziale basata su LLM.
- La pipeline separa la pianificazione in un piano orizzontale 2D (LLM) e un esecutore verticale deterministico.
- GPT-4o-mini con la pipeline raggiunge una precisione strutturale media del 94,6% sul benchmark Build What I Mean.
- La precisione è entro 3,0 punti percentuali dal tetto del 97,6% dovuto agli errori dell'agente architetto.
- Supera GPT-4o (90,3%) e il miglior sistema concorrente (76,3%).
- L'ablazione mostra che la decomposizione 2.5-D rappresenta il 50,7% del miglioramento.
- Il metodo elimina gli errori sistematici di coordinate nel posizionamento di blocchi 3D.
- Consente ai sistemi autonomi di seguire istruzioni di costruzione in linguaggio naturale.
Entità
Istituzioni
- arXiv