LLM Leggeri per la Generazione di Pareri Giudiziari
Uno studio esplora modelli linguistici di grandi dimensioni (LLM) leggeri, con meno di 2 miliardi di parametri, per la Generazione di Pareri Giudiziari Penali (CVG), un compito di Intelligenza Artificiale Legale che produce pareri giudiziari a partire dai fatti del caso. La ricerca affronta quattro domande: l'impatto dell'architettura LLM sulla qualità della CVG e sulla previsione delle accuse, il ruolo della dimensione del modello, il confronto con le Reti Neurali Profonde (DNN) e se generare prima il parere giudiziario migliori la previsione delle accuse rispetto alla previsione diretta. Gli autori hanno sviluppato CVGEvalKit, un framework di valutazione con tre dataset pubblici per CVG e previsione delle accuse. Sono stati condotti esperimenti completi su questo framework, con modelli addestrati su un mix di dati.
Fatti principali
- Vengono esplorati LLM leggeri (con meno di 2 miliardi di parametri) per la CVG.
- La CVG è un compito critico nell'IA Legale.
- Vengono affrontate quattro domande chiave riguardanti architettura, dimensione, confronto con DNN e ordine di previsione.
- CVGEvalKit è un framework di valutazione con tre dataset pubblici.
- I modelli sono addestrati su un mix di dati.
- Lo studio è pubblicato su arXiv con ID 2605.16770.
- Il tipo di annuncio è cross.
- La ricerca esplora sistematicamente gli LLM leggeri per la CVG.
Entità
Istituzioni
- arXiv