Agentopic: flusso di lavoro basato su LLM per il topic modeling spiegabile
Agentopic introduce un innovativo flusso di lavoro basato su agenti per il topic modeling spiegabile, sfruttando i punti di forza del ragionamento dei Large Language Models (LLM). I metodi tradizionali come la Latent Dirichlet Allocation (LDA) e BERTopic spesso non forniscono chiarezza sulle assegnazioni dei topic. Per rimediare a ciò, Agentopic impiega diversi agenti che lavorano insieme per identificare i topic, validarli, raggrupparli gerarchicamente e fornire spiegazioni in linguaggio naturale. Questo approccio consente agli utenti di comprendere la logica alla base delle assegnazioni dei topic, migliorando così l'interpretabilità pur mantenendo l'accuratezza. Testato con il dataset della British Broadcasting Corporation (BBC), Agentopic ha raggiunto un F1-score di 0,95, paragonabile a GPT-4.1, superando LDA (0,93) e avvicinandosi a BERTopic (0,98). Inoltre, la versione non seedata di Agentopic ha arricchito il dataset BBC con spiegazioni migliorate.
Fatti principali
- Agentopic è un nuovo flusso di lavoro basato su agenti per il topic modeling spiegabile.
- Sfrutta le capacità di ragionamento dei Large Language Models (LLM).
- Approcci esistenti come LDA e BERTopic mancano di trasparenza.
- Agentopic utilizza più agenti per l'identificazione, la validazione, il raggruppamento gerarchico e la spiegazione dei topic.
- Consente agli utenti di tracciare il ragionamento alla base delle assegnazioni dei topic.
- Seedato con il dataset BBC, Agentopic raggiunge un F1-score di 0,95.
- Ciò eguaglia GPT-4.1, migliora LDA (0,93) ed è vicino a BERTopic (0,98).
- Agentopic non seedato ha generato spiegazioni per arricchire il dataset BBC.
Entità
Istituzioni
- British Broadcasting Corporation (BBC)