ARTFEED — Contemporary Art Intelligence

Framework LLM Genera Dataset di Dialoghi Medici a Lungo Termine

ai-technology · 2026-05-20

Un nuovo framework utilizza modelli linguistici di grandi dimensioni per sintetizzare dialoghi medici di alta qualità e a lungo termine, affrontando la mancanza di dataset per valutare la memoria degli agenti sanitari. L'approccio costruisce profili sintetici di pazienti con diverse traiettorie di malattia, genera dialoghi multi-turno per ogni incontro e li integra in un dataset longitudinale coerente chiamato MediLongChat. Tre compiti di benchmark—Ragionamento Intra-dialogo, Ragionamento Inter-dialogo e Ragionamento di Sintesi—sono stabiliti per valutare le capacità di memoria. Il lavoro è presentato in un articolo su arXiv (2605.19766v1).

Fatti principali

  • Il framework sintetizza dialoghi medici a lungo termine utilizzando LLM
  • Affronta l'assenza di dataset con linee temporali longitudinali realistiche
  • Approccio in tre fasi: profili paziente, dialoghi multi-turno, integrazione
  • Creato il dataset MediLongChat
  • Tre compiti di benchmark per la valutazione della memoria
  • Articolo su arXiv: 2605.19766v1
  • Testi clinici reali vincolati da privacy ed etica
  • I benchmark esistenti non catturano il ragionamento tra sessioni

Entità

Istituzioni

  • arXiv

Fonti