PILOT: Ottimizzatore Adattivo Regola le Regole di Aggiornamento Durante l'Addestramento
Presentiamo PILOT (Policy-Informed Learned OpTimizer), un nuovo ottimizzatore che modifica la propria strategia di aggiornamento durante l'addestramento del deep learning valutando l'accordo di direzione del gradiente. A differenza degli ottimizzatori statici tradizionali, che mantengono una forma funzionale predeterminata, PILOT sfrutta questo accordo come indicatore della stabilità locale dell'addestramento. Ciò gli consente di passare tra aggiornamenti basati su momentum, normalizzazione e segno in risposta a gradienti stabili, rumorosi o incoerenti. I test su FashionMNIST e CIFAR-10 dimostrano che PILOT supera costantemente gli altri ottimizzatori in termini di accuratezza su reti convoluzionali. Questo metodo innovativo supera i limiti degli ottimizzatori statici che non riescono ad adattarsi alla natura dinamica del comportamento del gradiente attraverso il panorama della funzione di perdita.
Fatti principali
- PILOT sta per Policy-Informed Learned OpTimizer
- Adatta il comportamento di aggiornamento durante l'addestramento in base all'accordo di direzione del gradiente
- L'accordo di direzione del gradiente segnala la stabilità locale dell'addestramento
- L'ottimizzatore si regola quando i gradienti diventano stabili, rumorosi o incoerenti
- Testato sui dataset FashionMNIST e CIFAR-10
- Ha raggiunto la massima accuratezza tra gli ottimizzatori valutati su reti convoluzionali
- Gli ottimizzatori statici hanno una forma funzionale fissa prima dell'inizio dell'addestramento
- L'addestramento può passare tra regimi stabili, rumorosi e incoerenti
Entità
—