ARTFEED — Contemporary Art Intelligence

Ricerca semantica implementata su 166 milioni di note cliniche in un ospedale pediatrico

other · 2026-04-30

In un importante ospedale pediatrico, i ricercatori hanno implementato un sistema di ricerca semantica che ha indicizzato le note cliniche di 1,68 milioni di pazienti, per un totale di 166 milioni di note (484 milioni di vettori). Questo sistema utilizza embeddings qwen3-embedding-0.6B ottimizzati tramite istruzioni e organizza i vettori in un database gestito con indicizzazione ottimizzata per lo storage, mentre i metadati full-text sono conservati in un archivio chiave-valore a bassa latenza, il tutto all'interno di un quadro di governance conforme a HIPAA. L'efficacia del sistema è stata valutata attraverso tre esperimenti mirati a perfezionare il modello di embedding e la strategia di chunking, utilizzando query generate da medici. Questa iniziativa affronta problemi di ingegneria, costi e governance che hanno ostacolato l'uso diffuso della ricerca semantica nei sistemi sanitari.

Fatti principali

  • 166 milioni di note cliniche indicizzate
  • 484 milioni di vettori
  • 1,68 milioni di pazienti
  • Utilizza embeddings qwen3-embedding-0.6B
  • Quadro di governance conforme a HIPAA
  • Tre esperimenti condotti
  • Query redatte da medici utilizzate per la valutazione
  • Implementato in un grande ospedale pediatrico

Entità

Istituzioni

  • arXiv

Fonti