MLP Siamese Migliora la Predizione degli Operoni Rispetto al Baseline DGEB
Un nuovo metodo computazionale per l'identificazione degli operoni, denominato Siamese Contrastive Operon Pair Embeddings (SCOPE), supera il benchmark DGEB utilizzando un classificatore MLP Siamese su spazi di embedding fusi. La predizione degli operoni è fondamentale per comprendere la regolazione genica procariotica, consentendo la ricostruzione di reti regolatorie e lo sviluppo di farmaci. Mentre i metodi sperimentali come RT-PCR e RNA-seq sono accurati, sono laboriosi e limitati a organismi modello, rendendo necessari approcci computazionali scalabili. I metodi precedenti utilizzavano regressione logistica e alberi decisionali come baselines. DGEB incorpora sequenze indipendentemente con un modello linguistico proteico pre-addestrato e calcola la similarità coseno a coppie. SCOPE invece apprende un classificatore su embedding fusi, migliorando le prestazioni di classificazione. Lo studio è stato pubblicato su arXiv (2605.11022) come annuncio cross-type.
Fatti principali
- SCOPE utilizza un classificatore MLP Siamese su spazi di embedding fusi
- Il benchmark DGEB utilizza embedding indipendenti con similarità coseno a coppie
- L'identificazione degli operoni è fondamentale per comprendere la regolazione genica procariotica
- Metodi sperimentali come RT-PCR e RNA-seq sono precisi ma laboriosi
- I precedenti approcci computazionali utilizzavano regressione logistica e alberi decisionali
- Il metodo è stato pubblicato su arXiv con ID 2605.11022
- Il tipo di annuncio è cross
- SCOPE migliora rispetto al baseline DGEB
Entità
Istituzioni
- arXiv