Il Modello AI BioHiCL Migliora il Recupero di Informazioni Biomediche Utilizzando l'Apprendimento Contrastivo Gerarchico
Un nuovo modello di intelligenza artificiale chiamato BioHiCL è stato sviluppato per migliorare il recupero di informazioni biomediche sfruttando le annotazioni gerarchiche MeSH per una supervisione strutturata nell'apprendimento contrastivo multi-label. Il sistema affronta le limitazioni dei recuperatori generativi biomedici esistenti che si basano su segnali di rilevanza binari grossolani, che non riescono a catturare adeguatamente la sovrapposizione semantica tra i testi. Sono state create due versioni del modello: BioHiCL-Base con 0,1 miliardi di parametri e BioHiCL-Large con 0,3 miliardi di parametri. Questi modelli dimostrano prestazioni promettenti in molteplici compiti biomedici, tra cui recupero, valutazione della similarità delle frasi e risposta alle domande, mantenendo al contempo l'efficienza computazionale per un impiego pratico. La ricerca è stata pubblicata su arXiv, una piattaforma per preprint scientifici, nelle categorie informatica e recupero delle informazioni. Il framework utilizza arXivLabs, che consente ai collaboratori della comunità di sviluppare e condividere funzionalità sperimentali rispettando i valori di apertura, eccellenza comunitaria e privacy dei dati degli utenti. Il recupero di informazioni biomediche richiede una modellazione sofisticata della semantica specifica del dominio e delle relazioni gerarchiche tra i testi, che BioHiCL affronta attraverso il suo approccio innovativo all'apprendimento contrastivo. L'efficienza computazionale del sistema lo rende adatto all'implementazione nel mondo reale nella ricerca biomedica e nei sistemi informativi.
Fatti principali
- BioHiCL utilizza annotazioni gerarchiche MeSH per l'apprendimento contrastivo multi-label
- Esistono due versioni del modello: BioHiCL-Base (0,1 miliardi di parametri) e BioHiCL-Large (0,3 miliardi di parametri)
- Il sistema migliora il recupero di informazioni biomediche, la similarità delle frasi e la risposta alle domande
- I recuperatori biomedici esistenti utilizzano segnali di rilevanza binari grossolani
- La ricerca è stata pubblicata su arXiv nella categoria informatica/recupero delle informazioni
- Il framework arXivLabs consente lo sviluppo comunitario di funzionalità sperimentali
- I modelli mantengono l'efficienza computazionale per il dispiegamento
- Il recupero biomedico richiede la modellazione della semantica di dominio e delle relazioni gerarchiche
Entità
Istituzioni
- arXiv
- arXivLabs