EPM-RL: Apprendimento per Rinforzo per il Mapping di Prodotti On-Premise nell'E-Commerce

other · 2026-04-29

EPM-RL è un framework di apprendimento per rinforzo per costruire modelli di mapping di prodotti e-commerce on-premise accurati ed efficienti. Il mapping di prodotti determina se due inserzioni si riferiscono allo stesso prodotto, cruciale per il monitoraggio dei prezzi e la visibilità sui canali. I venditori spesso utilizzano parole chiave promozionali, tag specifici della piattaforma e descrizioni di bundle, facendo sì che lo stesso prodotto appaia sotto molti nomi. I framework esistenti basati su LLM e multi-agente migliorano la robustezza ma si basano su costose API esterne e orchestrazioni complesse, ostacolando la distribuzione su larga scala in contesti aziendali sensibili alla privacy. EPM-RL distilla il ragionamento agentivo ad alto costo in un modello interno addestrabile, partendo da un dataset curato. Il framework affronta i problemi di costo e privacy consentendo la distribuzione on-premise senza chiamate API esterne.

Fatti principali

EPM-RL è un framework di apprendimento per rinforzo per il mapping di prodotti on-premise nell'e-commerce.
Il mapping di prodotti decide se due inserzioni e-commerce si riferiscono allo stesso prodotto.
I venditori inseriscono parole chiave promozionali, tag specifici della piattaforma e descrizioni di bundle nei titoli.
I framework esistenti basati su LLM e multi-agente migliorano la robustezza ma sono costosi e dipendono da API esterne.
EPM-RL distilla il ragionamento agentivo ad alto costo in un modello interno addestrabile.
Il framework è progettato per contesti aziendali sensibili alla privacy.
Consente la distribuzione su larga scala senza costose chiamate API esterne.
L'approccio parte da un dataset curato.

Entità

—

Fonti

arXiv cs.AI — 2026-04-28