La regolarizzazione del flusso semantico migliora la diversità dell'output dei LLM
I ricercatori hanno sviluppato un nuovo metodo chiamato Semantic Flow Regularization (SFR) per affrontare il Cross-Style Collapse nei grandi modelli linguistici. Questo problema si verifica quando i modelli ottimizzati per stili specifici finiscono per produrre output meno diversificati. La causa sottostante è l'obiettivo di entropia incrociata che limita la variazione nelle rappresentazioni condivise. SFR funge da semplice obiettivo aggiuntivo, guidando il modello con embedding continui di codificatori di frasi per segmenti futuri tramite conditional flow matching. Mantiene intatta la multi-modalità e la testa di flow matching viene rimossa durante l'inferenza, senza costi aggiuntivi per il deployment. I test sul dataset Qwen3-32B, con 9 personaggi, mostrano che SFR migliora la diversità dell'output, la coerenza stilistica e la qualità delle risposte. La validazione su LiveCodeBench-v5 conferma questi miglioramenti. Puoi consultare lo studio su arXiv, identificatore 2605.27971.
Fatti principali
- 1. SFR affronta il Cross-Style Collapse nei LLM.
- 2. Il Cross-Style Collapse è causato dall'obiettivo di entropia incrociata che sopprime le continuazioni diversificate.
- 3. SFR utilizza il conditional flow matching con embedding di codificatori di frasi.
- 4. La testa di flow matching viene scartata durante l'inferenza, senza costi di deployment aggiuntivi.
- 5. Testato su Qwen3-32B con 9 personaggi.
- 6. Migliora la diversità dell'output, la fedeltà stilistica e la qualità delle risposte rispetto a SFT.
- 7. Validato su LiveCodeBench-v5 con Qwen2.5-Coder-7B-Instruct.
- 8. Articolo disponibile su arXiv: 2605.27971.
Entità
Istituzioni
- arXiv