Nuovo algoritmo RASLIK migliora l'unlearning dei LLM attraverso il miglioramento Pareto dei dati

ai-technology · 2026-04-22

I ricercatori hanno proposto una nuova strategia per l'unlearning automatico nei grandi modelli linguistici (LLM) per affrontare il problema reale del recupero dei dati. Questa tecnica innovativa, denominata Randomized Antipodal Search on Linearized Influence Kernel (RASLIK), integra l'hashing di permutazione-proiezione con la ricerca antipodale randomizzata, mirando a minimizzare la varianza di selezione. L'algoritmo implementa il principio del miglioramento Pareto dei dati, che chiarisce come il recupero possa migliorare l'equilibrio tra l'eliminazione di conoscenze indesiderate e la conservazione di informazioni preziose. Documentato nella prestampa arXiv 2604.16591v1, questo studio affronta la sfida dei LLM che conservano contenuti indesiderati dopo il dispiegamento. A differenza dei metodi precedenti che si concentravano sull'ottimizzazione con insiemi disponibili presupposti, questa ricerca dà priorità alle complicazioni di recupero derivanti da output indesiderati durante l'inferenza. Il documento include un abstract di tipo cross-announcement che dettaglia questi progressi nell'unlearning automatico.

Fatti principali

I grandi modelli linguistici a volte memorizzano conoscenze indesiderate che devono essere rimosse dopo il dispiegamento
Il lavoro precedente sull'unlearning automatico si concentrava su metodi di ottimizzazione che presupponevano insiemi di dimenticanza e conservazione disponibili
L'unlearning viene tipicamente attivato da generazioni indesiderate al momento dell'inferenza
Il recupero di dati rilevanti è la sfida centrale negli scenari pratici di unlearning
I ricercatori hanno introdotto il miglioramento Pareto dei dati per l'unlearning dei LLM
Il miglioramento Pareto dei dati formalizza come il recupero espanda la frontiera di compromesso tra dimenticanza e conservazione
Randomized Antipodal Search on Linearized Influence Kernel (RASLIK) è l'algoritmo di recupero proposto
RASLIK combina l'hashing di permutazione-proiezione con la ricerca antipodale randomizzata per ridurre la varianza di selezione

Entità

—

Fonti

arXiv cs.AI — 2026-04-21