AttnGen: un framework guidato dall'attenzione migliora la classificazione delle sequenze genomiche
Un nuovo framework di addestramento chiamato AttnGen incorpora l'interpretabilità direttamente nel processo di ottimizzazione per reti neurali profonde che classificano sequenze genomiche. Calcola punteggi di importanza a livello di nucleotide tramite un meccanismo di attenzione, sopprimendo progressivamente le posizioni a basso contributo durante l'addestramento per concentrare le previsioni su regioni informative. Sul benchmark demo_human_or_worm (classificazione binaria su sequenze di 200 nucleotidi), AttnGen con mascheramento moderato raggiunge un'accuratezza di validazione del 96,73%, superando la baseline CNN convenzionale al 95,83%, convergendo anche più velocemente. Il lavoro è descritto in arXiv:2605.14073.
Fatti principali
- 1. AttnGen è un framework di addestramento guidato dall'attenzione per la classificazione di sequenze genomiche.
- 2. Calcola punteggi di importanza a livello di nucleotide utilizzando un meccanismo di attenzione.
- 3. Le posizioni a basso contributo vengono progressivamente soppresse durante l'addestramento.
- 4. Valutato sul benchmark demo_human_or_worm con sequenze di 200 nucleotidi.
- 5. Accuratezza di validazione: 96,73% con mascheramento moderato.
- 6. Accuratezza baseline CNN: 95,83%.
- 7. AttnGen mostra una convergenza più rapida rispetto alla baseline.
- 8. Descritto in arXiv:2605.14073.
Entità
Istituzioni
- arXiv