Framework LLM Genera Dataset di Dialoghi Medici a Lungo Termine
Un nuovo framework utilizza modelli linguistici di grandi dimensioni per sintetizzare dialoghi medici di alta qualità e a lungo termine, affrontando la mancanza di dataset per valutare la memoria degli agenti sanitari. L'approccio costruisce profili sintetici di pazienti con diverse traiettorie di malattia, genera dialoghi multi-turno per ogni incontro e li integra in un dataset longitudinale coerente chiamato MediLongChat. Tre compiti di benchmark—Ragionamento Intra-dialogo, Ragionamento Inter-dialogo e Ragionamento di Sintesi—sono stabiliti per valutare le capacità di memoria. Il lavoro è presentato in un articolo su arXiv (2605.19766v1).
Fatti principali
- Il framework sintetizza dialoghi medici a lungo termine utilizzando LLM
- Affronta l'assenza di dataset con linee temporali longitudinali realistiche
- Approccio in tre fasi: profili paziente, dialoghi multi-turno, integrazione
- Creato il dataset MediLongChat
- Tre compiti di benchmark per la valutazione della memoria
- Articolo su arXiv: 2605.19766v1
- Testi clinici reali vincolati da privacy ed etica
- I benchmark esistenti non catturano il ragionamento tra sessioni
Entità
Istituzioni
- arXiv