Decodifica iper-parallela aumenta l'efficienza dei LLM per l'estrazione di valori di attributi

ai-technology · 2026-04-30

I ricercatori hanno introdotto Hyper-Parallel Decoding (HPD), un nuovo algoritmo che accelera la decodifica offline nei modelli linguistici di grandi dimensioni (LLM) per compiti come l'Estrazione di Valori di Attributi (AVE). Sfruttando l'indipendenza condizionale delle coppie attributo-valore, HPD consente la generazione parallela di più sequenze dallo stesso contesto documentale. Attraverso la manipolazione degli ID di posizione, i token possono essere generati fuori ordine, permettendo fino a 96 token per prompt quando si impilano più documenti. HPD è compatibile con tutti gli LLM e riduce i costi e i tempi di inferenza fino a 13,8 volte. L'articolo è disponibile su arXiv con ID 2604.26209.

Fatti principali

Hyper-Parallel Decoding (HPD) è un nuovo algoritmo di decodifica per LLM.
HPD è mirato ai compiti di Estrazione di Valori di Attributi (AVE).
Sfrutta l'indipendenza condizionale delle coppie attributo-valore.
Parallelizza la generazione dei valori all'interno di ogni prompt.
Consente la generazione di token fuori ordine tramite la manipolazione degli ID di posizione.
Può decodificare fino a 96 token per prompt impilando più documenti.
Funziona con tutti gli LLM.
Riduce i costi e i tempi di inferenza fino a 13,8 volte.

Decodifica iper-parallela aumenta l'efficienza dei LLM per l'estrazione di valori di attributi

Fatti principali

Entità

Istituzioni

Fonti