Attrito di Serializzazione: I LLM Faticano con Compiti 2D in Input 1D

ai-technology · 2026-05-01

Un nuovo studio da arXiv (2604.27272) introduce il concetto di "attrito di serializzazione" nei modelli linguistici di grandi dimensioni (LLM). I ricercatori hanno scoperto che l'elaborazione di dati strutturati 2D come sequenze di token 1D impone un onere rappresentativo per compiti come la trasposizione di matrici, il Gioco della Vita di Conway e la decomposizione LU. Hanno confrontato un percorso solo testuale con un percorso potenziato dalla visione sullo stesso backbone linguistico, dove quest'ultimo riceveva il contenuto in un layout 2D. Il percorso visivo ha costantemente superato quello solo testuale, suggerendo che la linearizzazione interrompe l'allineamento riga-colonna e il riconoscimento del vicinato locale. Lo studio fornisce un banco di prova diagnostico per comprendere questa limitazione.

Fatti principali

Lo studio proviene dal preprint arXiv 2604.27272.
Gli LLM elaborano input strutturati come sequenze di token 1D.
L'attrito di serializzazione si riferisce alla difficoltà aggiuntiva derivante dalla linearizzazione di strutture 2D.
I compiti testati includono trasposizione di matrici, Gioco della Vita di Conway e decomposizione LU.
È stato confrontato un percorso potenziato dalla visione con un percorso solo testuale.
Entrambi i percorsi utilizzavano lo stesso backbone linguistico.
Il percorso visivo ha costantemente superato il percorso solo testuale.
Lo studio fornisce un banco di prova diagnostico per l'attrito di serializzazione.

Attrito di Serializzazione: I LLM Faticano con Compiti 2D in Input 1D

Fatti principali

Entità

Istituzioni

Fonti