I modelli linguistici mostrano un divario tra generazione e verifica dei fatti
Un nuovo studio su arXiv (2605.27564) indaga il divario generazione-verifica (GV-gap) nei modelli linguistici, dove i modelli verificano i fatti in modo più affidabile di quanto li generino. La ricerca si concentra sulla conoscenza fattuale attraverso tre fasi di addestramento—acquisizione, apprendimento continuo e aggiornamento—utilizzando quattro famiglie di modelli open-source a due scale ciascuna. I risultati principali includono: la verifica viene appresa prima della generazione, la verifica è più robusta all'apprendimento continuo e gli aggiornamenti fattuali possono creare uno stato 'multi-verso' in cui i modelli verificano simultaneamente risposte vecchie e nuove come corrette.
Fatti principali
- Il paper arXiv 2605.27564 esamina il divario generazione-verifica nei modelli linguistici.
- Il GV-gap si riferisce al fatto che i modelli verificano i fatti meglio di quanto li generino.
- Lo studio copre tre fasi di addestramento: acquisizione, apprendimento continuo e aggiornamento.
- Quattro famiglie di modelli open-source sono state testate a due scale ciascuna.
- La verifica viene costantemente appresa prima della generazione.
- La verifica è più robusta all'apprendimento continuo rispetto alla generazione.
- Gli aggiornamenti fattuali possono portare a uno stato 'multi-verso' con doppia verifica.
- La ricerca distingue i GV-gap fattuali da quelli computazionali ed estetici.
Entità
Istituzioni
- arXiv