ARTFEED — Contemporary Art Intelligence

Primo studio comparativo di DP, NER e LLM per la de-identificazione di testi clinici in olandese

ai-technology · 2026-04-25

Un nuovo studio da arXiv presenta la prima valutazione comparativa della privacy differenziale (DP), del riconoscimento di entità nominate (NER) e dei grandi modelli linguistici (LLM) per la de-identificazione di note cliniche in olandese. La ricerca, pubblicata come arXiv:2604.21421, valuta questi metodi singolarmente e in combinazioni ibride in cui la pre-elaborazione NER o LLM viene applicata prima della DP. Le prestazioni sono misurate in termini di perdita di privacy e utilità, con l'obiettivo di bilanciare garanzie formali di privacy con usabilità pratica secondo regolamenti come GDPR e HIPAA. Lo studio affronta l'alto costo e la lentezza della de-identificazione manuale, che rimane il gold standard ma è poco pratica per l'uso secondario su larga scala dei dati sanitari. Le pipeline automatizzate si basano tipicamente sul NER per identificare le entità protette da oscurare, mentre la DP offre garanzie formali di privacy. I LLM sono emersi recentemente come strumento per la de-identificazione di testi clinici. Questo lavoro confronta sistematicamente tutti e tre gli approcci su dati in lingua olandese, colmando una lacuna nella PNL clinica non inglese. I risultati dovrebbero informare lo sviluppo di sistemi automatizzati di de-identificazione più efficienti e rispettosi della privacy per i registri sanitari olandesi.

Fatti principali

  • Primo studio comparativo di DP, NER e LLM per la de-identificazione di testi clinici in olandese
  • Pubblicato come arXiv:2604.21421
  • Valuta i metodi singolarmente e in strategie ibride
  • Le strategie ibride applicano la pre-elaborazione NER o LLM prima della DP
  • Prestazioni valutate in base a perdita di privacy e utilità
  • Motivato dalla conformità a GDPR e HIPAA
  • La de-identificazione manuale è il gold standard ma costosa e lenta
  • Lo studio si concentra su note cliniche in lingua olandese

Entità

Istituzioni

  • arXiv
  • GDPR
  • HIPAA

Fonti