ICCU: Un Framework di Disapprendimento Continuo In-Context per Modelli Linguistici
Un nuovo framework chiamato ICCU (In-Context Continual Unlearning) è stato introdotto da ricercatori per gestire richieste di disapprendimento sequenziali nei modelli linguistici senza alterare i parametri del modello. A differenza degli approcci tradizionali di fine-tuning, ICCU genera regole di rifiuto comprensibili dai dataset di disapprendimento, che vengono poi utilizzate come filtro o tramite prompt di sistema durante l'inferenza. Questo framework raccoglie le regole in modo indipendente dall'ordine, prevenendo interferenze tra le richieste e consentendo la rimozione dei dati originali del forget-set dopo l'induzione delle regole. I risultati sperimentali mostrano una soppressione efficace della conoscenza target mantenendo l'utilità, dimostrando scalabilità per richieste sequenziali. Il documento di ricerca è disponibile su arXiv.
Fatti principali
- ICCU sta per In-Context Continual Unlearning.
- Gestisce richieste di disapprendimento sequenziali senza fine-tuning.
- Le regole sono indotte dai dataset di disapprendimento e applicate all'inferenza.
- Le regole possono essere utilizzate come filtro o tramite prompt di sistema.
- Nessun parametro del modello viene modificato.
- Le regole sono accumulate come un'unione indipendente dall'ordine.
- I dati originali del forget-set possono essere scartati dopo l'induzione delle regole.
- Gli esperimenti mostrano una soppressione efficace della conoscenza e la preservazione dell'utilità.
Entità
Istituzioni
- arXiv