EPM-RL: Apprendimento per Rinforzo per il Mapping di Prodotti On-Premise nell'E-Commerce
EPM-RL è un framework di apprendimento per rinforzo per costruire modelli di mapping di prodotti e-commerce on-premise accurati ed efficienti. Il mapping di prodotti determina se due inserzioni si riferiscono allo stesso prodotto, cruciale per il monitoraggio dei prezzi e la visibilità sui canali. I venditori spesso utilizzano parole chiave promozionali, tag specifici della piattaforma e descrizioni di bundle, facendo sì che lo stesso prodotto appaia sotto molti nomi. I framework esistenti basati su LLM e multi-agente migliorano la robustezza ma si basano su costose API esterne e orchestrazioni complesse, ostacolando la distribuzione su larga scala in contesti aziendali sensibili alla privacy. EPM-RL distilla il ragionamento agentivo ad alto costo in un modello interno addestrabile, partendo da un dataset curato. Il framework affronta i problemi di costo e privacy consentendo la distribuzione on-premise senza chiamate API esterne.
Fatti principali
- EPM-RL è un framework di apprendimento per rinforzo per il mapping di prodotti on-premise nell'e-commerce.
- Il mapping di prodotti decide se due inserzioni e-commerce si riferiscono allo stesso prodotto.
- I venditori inseriscono parole chiave promozionali, tag specifici della piattaforma e descrizioni di bundle nei titoli.
- I framework esistenti basati su LLM e multi-agente migliorano la robustezza ma sono costosi e dipendono da API esterne.
- EPM-RL distilla il ragionamento agentivo ad alto costo in un modello interno addestrabile.
- Il framework è progettato per contesti aziendali sensibili alla privacy.
- Consente la distribuzione su larga scala senza costose chiamate API esterne.
- L'approccio parte da un dataset curato.
Entità
—