LLM adattivi al dominio migliorano la leggibilità della comunicazione in caso di crisi
I ricercatori propongono un pipeline adattivo al dominio per migliorare la comunicazione in caso di crisi, ottimizzando un piccolo modello linguistico su dati paralleli curati. L'approccio espande un piccolo corpus di riferimento tramite recupero e filtraggio da corpora generali, quindi applica l'ottimizzazione delle preferenze per orientare gli output verso un inglese semplificato di livello A2 del CEFR. Valutazioni automatiche e umane mostrano una migliore leggibilità mantenendo l'adeguatezza. Lo studio suggerisce che l'inglese semplificato combinato con l'adattamento al dominio può fungere da lingua franca pratica per le emergenze quando la copertura multilingue completa non è disponibile.
Fatti principali
- 1. Il pipeline espande un piccolo corpus di riferimento recuperando e filtrando dati da corpora generali
- 2. Ottimizza un piccolo modello linguistico per la traduzione nel dominio delle crisi
- 3. Applica l'ottimizzazione delle preferenze per orientare gli output verso un inglese di livello A2 del CEFR
- 4. La valutazione automatica e umana mostra una migliore leggibilità con adeguatezza mantenuta
- 5. L'inglese semplificato con adattamento al dominio è proposto come lingua franca per la comunicazione di emergenza
- 6. Affronta la scarsità di dati paralleli curati nella comunicazione di crisi
- 7. Si concentra su disastri naturali e causati dall'uomo
- 8. Pubblicato su arXiv sotto Computer Science > Computation and Language
Entità
Istituzioni
- arXiv