SSDAU: Aumento dei Dati Semantici Strutturati per l'Estrazione Congiunta di Entità e Relazioni
Un nuovo metodo chiamato Aumento dei Dati Semantici Strutturati (SSDAU) affronta la debole generalizzazione nell'Estrazione Congiunta di Entità e Relazioni (JERE) causata da dati di addestramento di bassa qualità. Le tecniche esistenti di aumento dei dati spesso interrompono le strutture semantiche e le dipendenze, non riuscendo a generare dati aumentati efficaci. SSDAU preserva la struttura semantica segmentando il testo in base alle etichette delle entità e utilizzando un encoder per catturare le caratteristiche delle entità attraverso la consapevolezza del contesto. Esegue una ristrutturazione semantica delle entità per creare dati aumentati e fonde gli embedding contestualizzati con punteggi di similarità tradizionali per distinguere entità semanticamente simili. Il metodo è descritto in un articolo su arXiv (2605.23440).
Fatti principali
- SSDAU è un nuovo metodo di aumento dei dati per JERE.
- Preserva la struttura semantica durante l'aumento.
- Segmenta il testo in base alle etichette delle entità.
- Utilizza un encoder per caratteristiche delle entità consapevoli del contesto.
- Esegue una ristrutturazione semantica delle entità.
- Fonde embedding contestualizzati con punteggi di similarità.
- L'articolo è su arXiv con ID 2605.23440.
- Il metodo mira a migliorare la generalizzazione del modello.
Entità
Istituzioni
- arXiv