I Vision Transformer Mostrano un Sovradattamento Benigno nell'Addestramento Adversarial, Rivelano Nuove Ricerche

ai-technology · 2026-04-22

Uno studio teorico recente indica che i Vision Transformer (ViT) possono raggiungere un'efficace generalizzazione robusta attraverso l'addestramento adversarial, anche in casi di sovradattamento benigno. Questa ricerca, identificata come arXiv:2604.19724v1, rappresenta la prima esplorazione teorica dell'addestramento adversarial all'interno di framework ViT semplificati. Sebbene i ViT abbiano dimostrato prestazioni impressionanti in numerose attività di visione, rimangono comunque suscettibili a esempi adversarial, analogamente alle Reti Neurali Convoluzionali (CNN). I risultati suggeriscono che, in determinate condizioni—come un budget di perturbazione moderato e un rapporto segnale-rumore specifico—i ViT possono raggiungere una perdita di addestramento robusta e un errore di generalizzazione robusta quasi nulli in scenari specifici. Questa scoperta amplia la comprensione del sovradattamento benigno, precedentemente osservato solo nelle CNN, includendo anche i Vision Transformer.

Fatti principali

I Vision Transformer (ViT) rimangono vulnerabili agli esempi adversarial nonostante il loro successo nelle attività di visione
L'addestramento adversarial è una comune strategia di difesa empirica per i ViT
Le basi teoriche della robustezza dell'addestramento adversarial nei ViT erano precedentemente inesplorate
Questo lavoro presenta la prima analisi teorica dell'addestramento adversarial sotto architetture ViT semplificate
I ViT possono raggiungere una perdita di addestramento robusta e un errore di generalizzazione robusta quasi nulli in condizioni specifiche
Il sovradattamento benigno—una forte generalizzazione nonostante il sovradattamento—si verifica nei ViT con addestramento adversarial
Il sovradattamento benigno era stato precedentemente osservato solo nelle Reti Neurali Convoluzionali (CNN) con addestramento adversarial
La ricerca è stata pubblicata come arXiv:2604.19724v1 con tipo di annuncio: cross

Entità

—

Fonti

arXiv cs.AI — 2026-04-22