BoostTaxo: Induzione di Tassonomia Zero-Shot tramite Potenziamento LLM
BoostTaxo è un framework progettato per l'induzione di tassonomia zero-shot, che utilizza un LLM di tipo boosting, come dettagliato nell'articolo arXiv 2605.12520v1. Elabora termini specifici del dominio per identificare categorie genitore attraverso una strategia dal generale al dettaglio. Questa tecnica integra il raffinamento delle definizioni potenziato dal recupero, una selezione ibrida di candidati genitore, la valutazione dei candidati e la calibrazione dei punteggi basata sulla struttura. Un LLM leggero filtra efficacemente i potenziali candidati genitore, mentre un LLM più grande è responsabile della classificazione e del punteggio per una selezione precisa. La metodologia si concentra sul miglioramento della generalizzazione, dell'affidabilità strutturale e dell'efficienza in contesti sia zero-shot che su larga scala.
Fatti principali
- 1. BoostTaxo è un framework LLM di tipo boosting per l'induzione di tassonomia zero-shot.
- 2. Prende come input un insieme di termini di dominio.
- 3. L'identificazione dei genitori viene eseguita in modo dal generale al dettaglio.
- 4. I metodi includono il raffinamento delle definizioni potenziato dal recupero, la selezione ibrida di candidati genitore, la valutazione dei candidati e la calibrazione dei punteggi sensibile alla struttura.
- 5. Un LLM leggero filtra efficientemente i candidati genitore.
- 6. Un LLM su larga scala classifica e assegna punteggi ai candidati genitore per una selezione fine.
- 7. Le caratteristiche strutturali sono incorporate per calibrare i punteggi.
- 8. L'approccio è mirato a scenari zero-shot e su larga scala.
Entità
Istituzioni
- arXiv