Apprendimento Autosupervisionato e per Rinforzo per il Drift Concettuale nel Malware Android
Un recente framework introdotto da arXiv (2605.24294) propone l'uso di tecniche di apprendimento autosupervisionato e per rinforzo per adattare i rilevatori di malware Android al drift concettuale dopo il deployment. Questo metodo tratta la manutenzione come una sfida decisionale sequenziale, apprendendo una rappresentazione latente coerente attraverso l'apprendimento autosupervisionato durante la fase di inizializzazione. Blocca l'encoder, valuta il drift latente e impiega un adattatore leggero insieme a una testa di classificazione per gli adattamenti successivi. Un controllore di ottimizzazione delle politiche prossimali determina azioni di manutenzione economicamente vantaggiose in base alle condizioni del rilevatore, che includono utilità, ritenzione, segnali di drift e costi di aggiornamento. Testato su dataset di malware Android sia su emulatore che reali con caratteristiche statiche e dinamiche in un framework di deployment causale, il controllore RL mostra potenziale per minimizzare le spese di riaddestramento.
Fatti principali
- Il framework utilizza apprendimento autosupervisionato e per rinforzo per l'adattamento al drift concettuale
- Modella la manutenzione in fase di deployment come un problema decisionale sequenziale
- Apprende una rappresentazione latente stabile tramite apprendimento autosupervisionato durante l'inizializzazione
- Congela l'encoder e misura il drift latente in uno spazio di rappresentazione fisso
- Utilizza un adattatore addestrabile e una testa di classificazione per un adattamento downstream leggero
- Un controllore di ottimizzazione delle politiche prossimali seleziona azioni di manutenzione a basso costo
- Valutato su dataset di malware Android su emulatore e reali con caratteristiche statiche e dinamiche
- Protocollo di deployment causale utilizzato per la valutazione
Entità
Istituzioni
- arXiv