Ipotesi del Grafo di Conoscenza Compressivo: Fatti Selettivi del Grafo per la Generazione di Ipotesi Scientifiche
Un nuovo studio da arXiv (2605.27176) indaga quali fatti dei grafi di conoscenza siano più utili per la generazione di ipotesi scientifiche nei modelli linguistici. I ricercatori hanno perturbato grafi di conoscenza locali variando densità, ricchezza ontologica, topologia e struttura di controllo, testando Mistral-7B, Llama-3.1-70B e Gemini 2.5 Flash sulla generazione di ipotesi per materiali per batterie. Hanno scoperto che l'utilità del grafo è selettiva e dipendente dal modello: mentre il contesto del grafo modifica gli output, i modelli senza grafo di conoscenza recuperano comunque contenuti sostanziali dalle proprie conoscenze pregresse. Sottografi compatti top-k spesso approssimano il comportamento del grafo completo, anche quando le triplette di esito dichiarato vengono escluse. La compressione non è unica per il ranking semantico: anche sottoinsiemi casuali e basati sulla topologia recuperano gran parte del segnale. I risultati supportano un'ipotesi del Grafo di Conoscenza Compressivo consapevole della ridondanza.
Fatti principali
- Studio da arXiv:2605.27176
- Testa Mistral-7B, Llama-3.1-70B e Gemini 2.5 Flash
- Si concentra sulla generazione di ipotesi per materiali per batterie
- Perturba KG locali per densità, ricchezza ontologica, topologia, struttura di controllo
- Sottografi compatti top-k approssimano il comportamento del KG completo
- Output senza KG recuperano contenuti sostanziali del grafo dalle conoscenze pregresse del modello
- Sottoinsiemi casuali e basati sulla topologia recuperano il segnale
- Supporta l'ipotesi del Grafo di Conoscenza Compressivo consapevole della ridondanza
Entità
Istituzioni
- arXiv