ReaPER+: Ingegneria del Replay Buffer per l'Ottimizzazione di Circuiti Quantistici Robusta al Rumore

ai-technology · 2026-04-25

Uno studio recente presenta ReaPER+, una regola di replay avanzata progettata per l'apprendimento per rinforzo profondo finalizzato all'ottimizzazione di circuiti quantistici. Questo approccio passa dalla priorizzazione degli errori di differenza temporale (TD) nella fase iniziale di addestramento all'uso di campionamento basato sull'affidabilità man mano che le stime dei valori diventano più accurate. Affronta tre sfide chiave: la trascuratezza dell'affidabilità del target TD nei buffer di replay, la necessità di valutazioni quantistico-classiche complete nelle ricerche di architettura basate su curriculum e la frequente eliminazione di traiettorie prive di rumore a causa del rumore hardware. ReaPER+ dimostra miglioramenti dell'efficienza del campionamento di 4-32x rispetto a PER fisso, ReaPER e replay uniforme nei benchmark di compilazione quantistica e QAS, producendo costantemente circuiti più compatti. La sua validazione su LunarLander-v3 illustra la sua natura agnostica rispetto al dominio, posizionando il buffer di replay come strumento cruciale per l'ottimizzazione quantistica.

Fatti principali

ReaPER+ è una regola di replay ricotta per l'ottimizzazione di circuiti quantistici.
Passa dalla priorizzazione basata sull'errore TD al campionamento basato sull'affidabilità.
Affronta tre colli di bottiglia: buffer di replay che ignorano l'affidabilità del target TD, ricerca di curriculum che richiede valutazione completa e scarto di traiettorie prive di rumore.
Ottiene guadagni di efficienza del campionamento di 4-32x rispetto a PER fisso, ReaPER e replay uniforme.
Scopre costantemente circuiti più compatti nei benchmark di compilazione quantistica e QAS.
Validato su LunarLander-v3, mostrando un principio agnostico rispetto al dominio.
Tratta il buffer di replay come leva algoritmica primaria per l'ottimizzazione quantistica.
Pubblicato su arXiv con ID 2604.21863.

ReaPER+: Ingegneria del Replay Buffer per l'Ottimizzazione di Circuiti Quantistici Robusta al Rumore

Fatti principali

Entità

Istituzioni

Fonti