Reti Neurali Non Supervisionate Concatenano il Parlato Spontaneamente

ai-technology · 2026-04-25

Uno studio recente pubblicato su arXiv suggerisce che il processo fondamentale dell'evoluzione sintattica—la concatenazione—può essere modellato direttamente dal parlato non elaborato attraverso reti neurali profonde non supervisionate. I ricercatori hanno utilizzato modelli ciwGAN/fiwGAN, basati su reti neurali convoluzionali, addestrandoli su registrazioni acustiche di singole parole. Sorprendentemente, senza alcun accesso a dataset di più parole, questi modelli hanno iniziato a produrre output che includevano due o tre parole combinate, un fenomeno chiamato "concatenazione spontanea". Questo risultato è stato osservato in modo consistente in più modelli addestrati indipendentemente con diversi iperparametri e dataset. Inoltre, le reti addestrate su coppie di parole hanno dimostrato la capacità di creare nuove combinazioni mai viste, indicando i primi segni di composizionalità. Questa ricerca mette in discussione il tradizionale focus testuale dei modelli sintattici computazionali.

Fatti principali

arXiv:2305.01626v4
Tipo di annuncio: replace-cross
Focus sulla concatenazione come sotto-operazione di base della sintassi
Concatenazione spontanea osservata nei modelli ciwGAN/fiwGAN
Modelli addestrati solo su singole parole
Output con due o tre parole concatenate emersi
Replicato in più modelli con diversi iperparametri
Nuove combinazioni di parole formate dall'addestramento su coppie
Precursori della composizionalità rilevati negli output

Reti Neurali Non Supervisionate Concatenano il Parlato Spontaneamente

Fatti principali

Entità

Istituzioni

Fonti