DiscoverLLM: Addestrare LLM per aiutare gli utenti a formare e scoprire intenzioni
DiscoverLLM è un framework innovativo progettato per addestrare grandi modelli linguistici ad aiutare gli utenti a identificare le proprie intenzioni, anziché limitarsi a seguire comandi diretti. Questo metodo affronta richieste vaghe e aperte in cui gli utenti potrebbero non aver stabilito obiettivi specifici. Al centro di DiscoverLLM c'è un simulatore utente che rappresenta gli stati cognitivi attraverso una gerarchia di intenzioni, che diventano più chiare man mano che il modello offre scelte pertinenti. Il livello di chiarezza funge da segnale di ricompensa per l'ottimizzazione. Di conseguenza, i modelli vengono addestrati a collaborare esplorando flessibilmente diverse opzioni. Il documento di ricerca è disponibile su arXiv con ID 2602.03429.
Fatti principali
- DiscoverLLM è un framework per addestrare LLM ad aiutare gli utenti a scoprire intenzioni.
- Affronta richieste ambigue e aperte in cui gli utenti non hanno formato intenzioni.
- L'approccio utilizza un simulatore utente con una gerarchia di intenzioni.
- Le intenzioni si concretizzano progressivamente man mano che il modello presenta opzioni pertinenti.
- Il grado di concretizzazione funge da segnale di ricompensa per l'addestramento.
- I modelli imparano a collaborare divergendo adattivamente per esplorare opzioni.
- Il paper è su arXiv con ID 2602.03429.
Entità
Istituzioni
- arXiv