SimGym: Framework AI per Simulare Test A/B nell'E-Commerce
SimGym è un framework progettato per replicare i test A/B per piattaforme di e-commerce utilizzando agenti basati su modelli visione-linguaggio (VLM) in un ambiente browser live. Supera gli svantaggi dei test A/B convenzionali, che spesso deviano il traffico degli utenti, richiedono settimane per raggiungere la significatività statistica e possono influenzare negativamente l'esperienza utente. Il framework è composto da tre elementi principali: una pipeline di generazione di personae che crea archetipi di acquirenti e intenzioni basati su dati di clickstream reali; un sistema di agenti browser live che integra percezione multimodale, memoria episodica e salvaguardie per garantire esperienze di acquisto coerenti; e un metodo di valutazione che valuta le variazioni dei risultati simulati rispetto al comportamento reale degli acquirenti. SimGym è stato validato attraverso test A/B incentrati su temi UI guidati visivamente.
Fatti principali
- SimGym simula test A/B utilizzando agenti VLM in un browser live.
- I test A/B tradizionali deviano il traffico e richiedono settimane per la significatività.
- La pipeline di generazione di personae utilizza dati di clickstream di produzione.
- L'architettura degli agenti include percezione multimodale e memoria episodica.
- Il protocollo di valutazione confronta i cambiamenti simulati e reali dei risultati.
- Validato su test A/B di temi UI guidati visivamente.
- Il framework mira a ridurre i rischi dei test A/B live.
- Utilizza modelli visione-linguaggio per il comportamento degli agenti.
Entità
—