Le tracce di ragionamento dei LLM rivelano una pianificazione miope nel gioco da tavolo
Un nuovo studio da arXiv (2605.06840) introduce un metodo per estrarre alberi di ricerca dalle tracce di ragionamento dei LLM nel gioco del quattro in fila. I ricercatori hanno scoperto che la ricerca dei LLM è più superficiale di quella umana, con prestazioni previste dall'ampiezza e non dalla profondità. Le scelte delle mosse sono meglio spiegate da un modello miope che ignora i nodi profondi, confermato da interventi causali.
Fatti principali
- Il metodo estrae alberi di ricerca dalle tracce di ragionamento dei LLM
- Applicato al gioco da tavolo del quattro in fila
- La ricerca dei LLM è più superficiale di quella umana
- Le prestazioni sono previste dall'ampiezza della ricerca, non dalla profondità
- Le scelte delle mosse sono meglio spiegate da un modello miope che ignora i nodi profondi
- Uno studio di intervento causale ha confermato i risultati
- Pubblicato su arXiv con ID 2605.06840
Entità
Istituzioni
- arXiv