ARTFEED — Contemporary Art Intelligence

WaferSAGE: Analisi dei Difetti dei Wafer tramite Dati Sintetici e RL Guidato da Rubriche

ai-technology · 2026-05-01

WaferSAGE è un framework progettato per il visual question answering relativo ai difetti dei wafer, utilizzando modelli compatti di visione-linguaggio. Affronta il problema della scarsità di dati nella produzione di semiconduttori attraverso un processo di sintesi in tre fasi che include la generazione di rubriche strutturate. Inizialmente, si parte da un piccolo numero di mappe di wafer etichettate, dove filtri di pulizia basati su clustering aiutano a eliminare il rumore. Successivamente, modelli di visione-linguaggio creano descrizioni dei difetti che vengono trasformate in rubriche di valutazione. Queste rubriche facilitano la sintesi di coppie VQA, affrontando aspetti come il tipo di difetto, la distribuzione spaziale, la morfologia e l'analisi delle cause profonde. Un framework di valutazione duale integra metriche basate su regole con punteggi LLM-Judge tramite ottimizzazione bayesiana per una valutazione automatica, impiegando apprendimento per rinforzo basato su curriculum insieme a Group Sequence Policy Optimization (GSPO) e ricompense allineate alle rubriche.

Fatti principali

  • WaferSAGE è un framework per il visual question answering sui difetti dei wafer.
  • Utilizza piccoli modelli di visione-linguaggio.
  • Una pipeline di sintesi in tre fasi incorpora la generazione di rubriche strutturate.
  • Filtri di pulizia basati su clustering rimuovono il rumore dalle etichette di un numero limitato di mappe di wafer.
  • Le descrizioni dei difetti sono generate da modelli di visione-linguaggio e convertite in rubriche.
  • Le rubriche guidano la sintesi di coppie VQA per tipo di difetto, distribuzione spaziale, morfologia e analisi delle cause profonde.
  • Un framework di valutazione duale allinea metriche basate su regole con punteggi LLM-Judge tramite ottimizzazione bayesiana.
  • L'apprendimento per rinforzo basato su curriculum utilizza Group Sequence Policy Optimization (GSPO) e ricompense allineate alle rubriche.

Entità

Fonti