ARTFEED — Contemporary Art Intelligence

La decomposizione 2.5-D aumenta la precisione nella costruzione spaziale degli LLM al 94,6%

ai-technology · 2026-05-11

Un nuovo approccio neuro-simbolico noto come decomposizione 2.5-D migliora le prestazioni dei grandi modelli linguistici (LLM) nei compiti di costruzione spaziale. Questa tecnica, descritta in arXiv:2605.07066, divide la pianificazione in un piano orizzontale bidimensionale gestito dall'LLM, mentre un esecutore deterministico calcola i posizionamenti verticali in base all'occupazione delle colonne. Questo metodo affronta i comuni errori di coordinate nei posizionamenti di blocchi 3D derivanti da istruzioni in linguaggio naturale. Nel benchmark Build What I Mean (160 round), GPT-4o-mini che utilizza questa pipeline ha raggiunto una precisione strutturale media del 94,6% in 12 prove indipendenti, a soli 3,0 punti percentuali dal limite del 97,6% imposto dagli errori dell'agente architetto. Questo risultato supera il 90,3% di GPT-4o e il 76,3% del miglior concorrente. Uno studio di ablazione controllata ha rivelato che la decomposizione 2.5-D ha contribuito per il 50,7% al miglioramento, consentendo ai sistemi autonomi di costruire strutture a partire da istruzioni in linguaggio naturale con un ragionamento spaziale affidabile.

Fatti principali

  • arXiv:2605.07066 introduce la decomposizione 2.5-D per la costruzione spaziale basata su LLM.
  • La pipeline separa la pianificazione in un piano orizzontale 2D (LLM) e un esecutore verticale deterministico.
  • GPT-4o-mini con la pipeline raggiunge una precisione strutturale media del 94,6% sul benchmark Build What I Mean.
  • La precisione è entro 3,0 punti percentuali dal tetto del 97,6% dovuto agli errori dell'agente architetto.
  • Supera GPT-4o (90,3%) e il miglior sistema concorrente (76,3%).
  • L'ablazione mostra che la decomposizione 2.5-D rappresenta il 50,7% del miglioramento.
  • Il metodo elimina gli errori sistematici di coordinate nel posizionamento di blocchi 3D.
  • Consente ai sistemi autonomi di seguire istruzioni di costruzione in linguaggio naturale.

Entità

Istituzioni

  • arXiv

Fonti