Reti di Porte Logiche Consentono un Rilevamento Efficiente di Copie Video
Un nuovo framework che utilizza reti di porte logiche differenziabili (LGN) sostituisce gli estrattori di caratteristiche a virgola mobile tradizionali con rappresentazioni compatte basate sulla logica per rilevare copie video. Questo metodo integra una riduzione aggressiva dei fotogrammi, una preelaborazione binaria e un modello di embedding LGN addestrabile che apprende sia le operazioni logiche che le loro connessioni. Una volta addestrato, il modello viene convertito in un circuito puramente booleano, consentendo un'inferenza rapida ed efficiente in termini di memoria. La ricerca valuta rigorosamente varie tecniche di similarità, metodi di binarizzazione e progetti LGN su più fold di dataset e livelli di difficoltà. Questo studio affronta i problemi del costo computazionale e della dimensione dei descrittori che le reti neurali profonde devono affrontare, limitandone l'uso pratico in ambienti ad alto throughput. L'articolo su arXiv (2604.21694) presenta questo approccio come una soluzione efficace per il rilevamento di copie video su larga scala in mezzo a varie distorsioni visive.
Fatti principali
- Propone un framework per il rilevamento di copie video basato su reti di porte logiche differenziabili (LGN)
- Sostituisce gli estrattori di caratteristiche a virgola mobile con rappresentazioni compatte basate sulla logica
- Combina miniaturizzazione dei fotogrammi, preelaborazione binaria e modello di embedding LGN addestrabile
- Il modello viene discretizzato in un circuito puramente booleano per un'inferenza veloce
- Valutato su più fold di dataset e livelli di difficoltà
- Affronta il costo computazionale e la dimensione dei descrittori delle reti neurali profonde
- Pubblicato su arXiv con ID 2604.21694
Entità
Istituzioni
- arXiv