OmicsLM: LLM multimodale per il ragionamento multi-campione in omica
OmicsLM è un grande modello linguistico multimodale che integra dati quantitativi omici con compiti biologici espressi in linguaggio naturale. Codifica ogni profilo trascrittomico in un formato continuo e conciso all'interno del framework LLM, mantenendo i segnali quantitativi di espressione e consentendo l'elaborazione simultanea di direttive in linguaggio naturale, riferimenti specifici a geni e vari campioni biologici. L'addestramento ha coinvolto oltre 5,5 milioni di esempi di istruzioni in più di 70 diverse categorie di compiti, fondendo dati trascrittomici continui con informazioni sperimentali espresse attraverso una varietà di template linguistici.
Fatti principali
- OmicsLM è un LLM multimodale per il ragionamento multi-campione in omica.
- Collega profili omici quantitativi con compiti biologici in linguaggio naturale.
- Ogni profilo trascrittomico è rappresentato come una rappresentazione continua e compatta nel contesto LLM.
- L'interfaccia preserva il segnale quantitativo di espressione.
- Consente istruzioni in linguaggio naturale, menzioni esplicite di geni e molteplici campioni biologici intervallati.
- Addestrato su oltre 5,5 milioni di esempi di istruzioni.
- Copre più di 70 tipi di compiti.
- Combina input trascrittomici continui e dati sperimentali resi attraverso diversi template linguistici.
Entità
—