Modello di attribuzione causale migliora il ragionamento dei LLM
Un nuovo modello di attribuzione causale migliora l'interpretabilità e il ragionamento causale dei grandi modelli linguistici (LLM) attraverso un fine-tuning preciso. Il modello utilizza "do-operator" per creare scenari interventistici, quantificando i contributi dei componenti nel ragionamento dei LLM. I test su compiti di scoperta causale mostrano che i LLM dipendono fortemente dal contesto e dalla conoscenza del dominio, con una gestione limitata delle correlazioni numeriche. L'approccio motiva l'uso di LLM fine-tuned per la scoperta causale a coppie.
Fatti principali
- arXiv:2401.00139v3
- Il modello di attribuzione causale migliora l'interpretabilità dei LLM
- Utilizza do-operator per scenari interventistici
- Quantifica i contributi dei componenti nel ragionamento causale
- Testato su compiti di scoperta causale in vari domini
- La scoperta causale dei LLM dipende dal contesto e dalla conoscenza del dominio
- I LLM possono usare dati numerici per correlazione, non causalità
- Propone un LLM fine-tuned per la scoperta causale a coppie
Entità
—