Il Framework FineSteer Consente un Controllo Preciso al Momento dell'Inferenza nei Modelli Linguistici di Grande Dimensione
Un nuovo framework chiamato FineSteer offre un controllo granulare sul comportamento dei modelli linguistici di grande dimensione durante l'inferenza senza aggiornamenti dei parametri. Sviluppato per affrontare output indesiderati come violazioni della sicurezza e allucinazioni, l'approccio scompone lo steering in due fasi complementari. La prima fase impiega lo Steering Condizionale Guidato da Sottospazi per preservare l'utilità del modello evitando interventi non necessari. Nella seconda fase, un meccanismo a Miscela di Esperti di Steering cattura gli aspetti multimodali dei comportamenti desiderati. Questa ricerca affronta le limitazioni dei metodi esistenti che spesso sacrificano efficacia, preservazione dell'utilità o efficienza dell'addestramento. Il lavoro è documentato nel preprint arXiv 2604.15488v1. FineSteer consente un controllo preciso su quando e come orientare le rappresentazioni interne durante la generazione. Il framework rappresenta un'alternativa economicamente vantaggiosa al riaddestramento completo del modello per l'adeguamento del comportamento.
Fatti principali
- FineSteer è un framework unificato per lo steering granulare al momento dell'inferenza nei LLM
- Affronta comportamenti indesiderati come violazioni della sicurezza e allucinazioni
- Scompone lo steering in steering condizionale e sintesi vettoriale granulare
- La prima fase utilizza lo Steering Condizionale Guidato da Sottospazi per preservare l'utilità
- La seconda fase impiega un meccanismo a Miscela di Esperti di Steering
- Consente il controllo su quando e come orientare le rappresentazioni interne
- Identificatore preprint arXiv: 2604.15488v1
- Tipo di annuncio: cross
Entità
—