H Company Lancia il Modello AI Holotron-12B per Agenti di Utilizzo Computer su Hugging Face
H Company ha lanciato Holotron-12B, un modello multimodale per l'utilizzo computer ora accessibile tramite Hugging Face. Sviluppato a partire dalla base NVIDIA Nemotron-Nano-12B-v2-VL-BF16, il modello ha subito un fine-tuning supervisionato su dati proprietari focalizzati sulla comprensione dello schermo e sulle interazioni con l'interfaccia utente. La sua architettura ibrida State-Space Model consente inferenze ad alta produttività, raggiungendo oltre il doppio della produttività di Holo2-8B nei test WebVoyager Benchmark con 100 lavoratori concorrenti. L'addestramento ha coinvolto circa 14 miliardi di token. I miglioramenti delle prestazioni includono punteggi WebVoyager passati dal 35,1% all'80,5%, superando Holo2-8B. Il modello opera sotto la licenza Open Model License di NVIDIA. H Company partecipa al programma NVIDIA Inception. NVIDIA ha recentemente annunciato Nemotron 3 Omni, con piani per adattare Holotron per applicazioni commerciali che richiedono implementazioni autonome su larga scala.
Fatti principali
- Holotron-12B è un modello multimodale per l'utilizzo computer rilasciato da H Company
- Il modello si basa sull'architettura NVIDIA Nemotron-Nano-12B-v2-VL-BF16
- Ha raggiunto oltre 2 volte la produttività di Holo2-8B su WebVoyager Benchmark
- L'addestramento ha utilizzato circa 14 miliardi di token di dati proprietari
- Le prestazioni WebVoyager sono migliorate dal 35,1% all'80,5%
- Il modello è disponibile su Hugging Face sotto la licenza NVIDIA Open Model License
- H Company fa parte del programma NVIDIA Inception
- NVIDIA ha annunciato Nemotron 3 Omni con piani per implementazioni commerciali
Entità
Istituzioni
- H Company
- NVIDIA
- Hugging Face