La ricerca rivela che le capacità di pianificazione latente nei grandi modelli linguistici aumentano con la scala

ai-technology · 2026-04-15

Uno studio pubblicato su arXiv esamina se i grandi modelli linguistici attuino una pianificazione latente quando eseguono compiti che sembrano richiedere un pensiero progettuale. La ricerca definisce la pianificazione latente come il fenomeno per cui i modelli sviluppano rappresentazioni interne che causano specifici output futuri e modellano il contesto precedente per giustificare tali output. Gli esperimenti sono stati condotti utilizzando la famiglia di modelli Qwen-3, con parametri da 0,6 miliardi a 14 miliardi, su semplici compiti di pianificazione. I risultati indicano che la capacità di pianificazione latente migliora significativamente con l'aumentare della scala del modello. Ad esempio, i modelli che pianificano con successo sviluppano caratteristiche che rappresentano una parola target come "contabile", che poi influenza le scelte grammaticali come l'output di "un" invece di "uno". Anche i modelli più piccoli della serie Qwen-3, in particolare le versioni da 4B e 8B, mostrano segni precoci di meccanismi di pianificazione, sebbene siano meno efficaci. Su compiti più complessi, come completare distici in rima, i modelli identificano frequentemente una rima in anticipo. Tuttavia, la ricerca conclude che anche i modelli più grandi raramente pianificano molto in anticipo in questi scenari. L'articolo, identificato come arXiv:2604.12493v1, è stato annunciato come una presentazione interdisciplinare.

Fatti principali

La pianificazione latente nei LLM coinvolge rappresentazioni interne che causano output futuri e modellano il contesto.
Lo studio ha utilizzato la famiglia di modelli Qwen-3 con parametri da 0,6B a 14B.
La capacità di pianificazione è risultata aumentare con la scala del modello.
I modelli che pianificano con successo sviluppano caratteristiche per parole target come "contabile".
Queste caratteristiche influenzano gli output, come scegliere "un" invece di "uno".
I modelli Qwen-3 più piccoli (4B-8B) mostrano meccanismi di pianificazione nascenti.
Nei compiti di distici in rima, i modelli spesso identificano le rime in anticipo.
Anche i modelli grandi raramente pianificano molto in anticipo su compiti complessi.

La ricerca rivela che le capacità di pianificazione latente nei grandi modelli linguistici aumentano con la scala

Fatti principali

Entità

Istituzioni

Fonti