CRiSP: Apprendimento per Rinforzo per la Preparazione di Stati Quantistici
I ricercatori propongono CRiSP (Clifford Reinforcement Learning agent for State Preparation), un framework che utilizza l'apprendimento per rinforzo per migliorare l'inizializzazione negli Algoritmi Quantistici Variazionali (VQA). I VQA affrontano sfide di ottimizzazione come plateau sterili e minimi locali. CRiSP formula la selezione di prefissi discreti come un problema decisionale sequenziale, impiegando la Ricerca ad Albero Monte Carlo guidata da Reti Neurali con una politica basata su Transformer addestrata tramite self-play. Inserisce porte Clifford apprese prima di rotazioni parametrizzate fisse, consentendo stati iniziali di alta qualità attraverso simulazione classica di stabilizzatori in tempo polinomiale senza alterare l'architettura del circuito. Il metodo mira a scalare meglio degli approcci euristici in spazi di ricerca combinatori vasti.
Fatti principali
- CRiSP sta per Clifford Reinforcement Learning agent for State Preparation
- Utilizza la Ricerca ad Albero Monte Carlo guidata da Reti Neurali
- Politica basata su Transformer addestrata tramite self-play
- Inserisce porte Clifford apprese prima di rotazioni parametrizzate fisse
- Consente simulazione classica di stabilizzatori in tempo polinomiale
- Affronta plateau sterili e minimi locali nei VQA
- Non altera l'architettura sottostante del circuito
- Pubblicato su arXiv con ID 2605.23138
Entità
Istituzioni
- arXiv