CRiSP: Apprendimento per Rinforzo per la Preparazione di Stati Quantistici

ai-technology · 2026-05-25

I ricercatori propongono CRiSP (Clifford Reinforcement Learning agent for State Preparation), un framework che utilizza l'apprendimento per rinforzo per migliorare l'inizializzazione negli Algoritmi Quantistici Variazionali (VQA). I VQA affrontano sfide di ottimizzazione come plateau sterili e minimi locali. CRiSP formula la selezione di prefissi discreti come un problema decisionale sequenziale, impiegando la Ricerca ad Albero Monte Carlo guidata da Reti Neurali con una politica basata su Transformer addestrata tramite self-play. Inserisce porte Clifford apprese prima di rotazioni parametrizzate fisse, consentendo stati iniziali di alta qualità attraverso simulazione classica di stabilizzatori in tempo polinomiale senza alterare l'architettura del circuito. Il metodo mira a scalare meglio degli approcci euristici in spazi di ricerca combinatori vasti.

Fatti principali

CRiSP sta per Clifford Reinforcement Learning agent for State Preparation
Utilizza la Ricerca ad Albero Monte Carlo guidata da Reti Neurali
Politica basata su Transformer addestrata tramite self-play
Inserisce porte Clifford apprese prima di rotazioni parametrizzate fisse
Consente simulazione classica di stabilizzatori in tempo polinomiale
Affronta plateau sterili e minimi locali nei VQA
Non altera l'architettura sottostante del circuito
Pubblicato su arXiv con ID 2605.23138

CRiSP: Apprendimento per Rinforzo per la Preparazione di Stati Quantistici

Fatti principali

Entità

Istituzioni

Fonti