ARTFEED — Contemporary Art Intelligence

Ottimizzazione di LLM Causal per la Classificazione del Testo: Metodi di Embedding vs. Istruzioni

publication · 2026-05-25

Uno studio disponibile su arXiv valuta due approcci per l'ottimizzazione di Large Language Models (LLM) decoder-only finalizzata alla classificazione del testo quando le risorse sono limitate: l'ottimizzazione basata su embedding (che prevede l'aggiunta di una testa di classificazione all'embedding del token finale) e l'ottimizzazione tramite istruzioni (che utilizza un formato prompt-to-response). La ricerca ha utilizzato la quantizzazione a 4 bit e il Low-Rank Adaptation (LoRA) su una singola GPU per modelli con fino a 8 miliardi di parametri. Esperimenti condotti su due benchmark di brevetti—un corpus proprietario a etichetta singola con cinque classi e il dataset pubblico WIPO-Alpha multi-etichetta con 14 categorie—indicano che la tecnica basata su embedding eguaglia o supera l'ottimizzazione tramite istruzioni nella classificazione a etichetta singola, richiedendo da 10 a 30 volte meno parametri. L'ottimizzazione tramite istruzioni risulta competitiva solo in scenari multi-etichetta. Questo articolo è catalogato su arXiv con ID 2512.12677.

Fatti principali

  • ID articolo arXiv: 2512.12677
  • Confronta l'ottimizzazione basata su embedding vs. tramite istruzioni per la classificazione del testo con LLM
  • Utilizza quantizzazione a 4 bit e LoRA per l'ottimizzazione su singola GPU fino a 8 miliardi di parametri
  • Esperimenti su due benchmark di brevetti: un dataset proprietario a 5 classi a etichetta singola e WIPO-Alpha multi-etichetta (14 categorie)
  • Il metodo basato su embedding eguaglia o supera l'ottimizzazione tramite istruzioni nei compiti a etichetta singola
  • Il metodo basato su embedding addestra da 10 a 30 volte meno parametri rispetto all'ottimizzazione tramite istruzioni
  • L'ottimizzazione tramite istruzioni è competitiva solo nella classificazione multi-etichetta
  • I modelli sono LLM causali decoder-only

Entità

Istituzioni

  • arXiv

Fonti