L'orchestrazione LLM causa un precipizio universale nel rilevamento dei difetti

ai-technology · 2026-05-27

Uno studio su arXiv (2605.26174) rivela che quando i sistemi di modelli linguistici di produzione utilizzano agenti lavoratori orchestrati per rispondere alle richieste, perdono universalmente la capacità di rilevare difetti trasversali—contraddizioni tra sezioni distanti del documento. Testando dieci modelli su cinque generazioni di uno sviluppatore e cinque fornitori con paradigmi di allineamento distinti, i ricercatori hanno trovato un precipizio di rilevamento universale: ogni modello che poteva trovare questi difetti sotto un singolo agente falliva sotto orchestrazione, con un calo del rilevamento di due terzi o più. Il precipizio è derivato dal meccanismo e non è mitigato dalla scala o dal ragionamento esteso. Tra i sei modelli che discriminavano sopra il caso dopo la caduta, una decomposizione del rilevamento del segnale ha mostrato comportamenti vari.

Fatti principali

Articolo arXiv 2605.26174
Studiato il rilevamento di difetti trasversali
Testati dieci modelli su cinque generazioni e cinque fornitori
Osservato un precipizio di rilevamento universale sotto orchestrazione
Il rilevamento cala di due terzi o più
Il precipizio è derivato dal meccanismo, non chiuso dalla scala o dal ragionamento
Sei modelli discriminavano sopra il caso dopo la caduta
Applicata la decomposizione del rilevamento del segnale

L'orchestrazione LLM causa un precipizio universale nel rilevamento dei difetti

Fatti principali

Entità

Istituzioni

Fonti