VectorArk: Nuovo Modello VLM per la Vettorizzazione Pratica di Immagini
Un nuovo modello visione-linguaggio (VLM) chiamato VectorArk è stato sviluppato da ricercatori per migliorare efficacemente la vettorizzazione delle immagini. A differenza dei precedenti approcci VLM che eccellevano solo in ambienti sintetici, VectorArk si adatta bene a immagini reali, incluse quelle con tecniche di rasterizzazione sconosciute o create da generatori testo-immagine. Utilizza un formato a poligoni arrotondati che facilita l'apprendimento e produce forme morbide ed esteticamente gradevoli. Inoltre, un modello di degradazione migliora la sua resilienza a vari input imperfetti. I risultati sperimentali indicano che VectorArk supera i metodi precedenti in termini di completezza geometrica e riduzione degli artefatti su diversi dataset. L'articolo di ricerca è disponibile su arXiv con l'identificatore 2605.24398.
Fatti principali
- VectorArk è un modello basato su VLM per la vettorizzazione di immagini.
- Utilizza una rappresentazione a poligoni arrotondati per primitive morbide.
- Un modello di degradazione migliora la robustezza agli input del mondo reale.
- Supera i metodi precedenti in completezza geometrica e soppressione degli artefatti.
- Testato su molteplici dataset.
- Affronta la scarsa generalizzazione dei precedenti metodi VLM a immagini reali.
- Progettato per immagini con rasterizzazione sconosciuta o output testo-immagine.
- Articolo disponibile su arXiv (2605.24398).
Entità
Istituzioni
- arXiv