Framework LLM Genera Dataset di Dialoghi Medici a Lungo Termine

ai-technology · 2026-05-20

Un nuovo framework utilizza modelli linguistici di grandi dimensioni per sintetizzare dialoghi medici di alta qualità e a lungo termine, affrontando la mancanza di dataset per valutare la memoria degli agenti sanitari. L'approccio costruisce profili sintetici di pazienti con diverse traiettorie di malattia, genera dialoghi multi-turno per ogni incontro e li integra in un dataset longitudinale coerente chiamato MediLongChat. Tre compiti di benchmark—Ragionamento Intra-dialogo, Ragionamento Inter-dialogo e Ragionamento di Sintesi—sono stabiliti per valutare le capacità di memoria. Il lavoro è presentato in un articolo su arXiv (2605.19766v1).

Fatti principali

Il framework sintetizza dialoghi medici a lungo termine utilizzando LLM
Affronta l'assenza di dataset con linee temporali longitudinali realistiche
Approccio in tre fasi: profili paziente, dialoghi multi-turno, integrazione
Creato il dataset MediLongChat
Tre compiti di benchmark per la valutazione della memoria
Articolo su arXiv: 2605.19766v1
Testi clinici reali vincolati da privacy ed etica
I benchmark esistenti non catturano il ragionamento tra sessioni

Framework LLM Genera Dataset di Dialoghi Medici a Lungo Termine

Fatti principali

Entità

Istituzioni

Fonti