DuIVRS-2: Sistema IVR basato su LLM per i dati POI in Baidu Maps
Presso Baidu Maps, i ricercatori hanno introdotto DuIVRS-2, un framework end-to-end che utilizza un modello linguistico di grandi dimensioni (LLM) per l'ampia raccolta di attributi dei Punti di Interesse (POI). Questo sistema innovativo affronta i problemi di accumulo di errori e gli elevati costi di manutenzione associati ai tradizionali sistemi IVR modulari. Impiega un approccio di data augmentation basato su macchina a stati finiti (FSM) per creare dataset di addestramento bilanciati, incorpora un metodo di generazione selettiva con un meccanismo Chain-of-Thought (CoT) per migliorare la stabilità dell'output e ridurre le allucinazioni, e implementa un framework di apprendimento iterativo collaborativo con doppia valutazione per un miglioramento continuo delle politiche.
Fatti principali
- DuIVRS-2 è un framework end-to-end basato su LLM per l'acquisizione di attributi POI.
- È progettato per la distribuzione su larga scala in Baidu Maps.
- I tradizionali sistemi IVR modulari soffrono di accumulo di errori e costi di manutenzione elevati.
- La metodologia utilizza data augmentation guidata da FSM per sintetizzare dati di addestramento bilanciati.
- Uno schema di generazione selettiva con meccanismo CoT garantisce stabilità dell'output ed elimina le allucinazioni.
- Un framework di apprendimento iterativo cooperativo con doppia valutazione consente un perfezionamento continuo delle politiche.
- Il sistema mira alla distribuzione a coda lunga delle interazioni nel mondo reale.
- Il lavoro è pubblicato su arXiv con ID 2605.17900.
Entità
Istituzioni
- Baidu Maps