PALoRA: Un framework in due fasi per l'iniezione di conoscenza nei LLM
Esiste un nuovo approccio chiamato PALoRA che cerca di risolvere il problema di mantenere sia flessibilità che stabilità nei modelli linguistici di grandi dimensioni, o LLM. Aiuta questi modelli a integrare la conoscenza in modo più efficace pur mantenendo buone capacità di ragionamento. L'idea nasce dalla consapevolezza che i dati importanti per il ragionamento sono in realtà distribuiti nelle matrici dei pesi dei percettroni multistrato, non solo nelle aree ovvie. In primo luogo, PALoRA addestra un esperto utilizzando il Singular Value Fine-Tuning su un dataset di ragionamento. Quindi utilizza il vettore di scaling derivato come riferimento stabile per trovare direzioni sensibili, il che aiuta a ridurre i conflitti durante l'aggiornamento della conoscenza fattuale. Puoi consultare i dettagli nel preprint arXiv 2605.24549.
Fatti principali
- PALoRA sta per Projection-Adaptive LoRA.
- Affronta il dilemma plasticità-stabilità nei LLM.
- Le informazioni critiche per il ragionamento sono distribuite nello spettro singolare.
- PALoRA utilizza un framework in due fasi per l'iniezione di conoscenza.
- La prima fase addestra un esperto SVF su un dataset di ragionamento.
- Il vettore di scaling singolare dell'esperto SVF funge da sonda geometrica congelata.
- Il metodo riduce l'interferenza con le capacità di ragionamento esistenti.
- Il preprint è disponibile su arXiv con ID 2605.24549.
Entità
Istituzioni
- arXiv