ARTFEED — Contemporary Art Intelligence

NVIDIA Lancia il Dataset Nemotron-Personas-Korea per lo Sviluppo di Agenti IA

ai-technology · 2026-04-21

NVIDIA ha introdotto Nemotron-Personas-Korea, un dataset di 6 milioni di persone sintetiche basate su statistiche ufficiali coreane provenienti da fonti come il Servizio di Informazione Statistica Coreana (KOSIS) e la Corte Suprema della Corea. Questo dataset, progettato per conformarsi alla Legge sulla Protezione delle Informazioni Personali (PIPA) della Corea del Sud, evita informazioni personalmente identificabili mentre ancorano gli agenti IA a dati demografici reali. È stato creato utilizzando NeMo Data Designer, un sistema open-source di NVIDIA che combina un Modello Grafico Probabilistico con Gemma-4-31B per la generazione di narrazioni in lingua coreana. Il dataset fa parte della più ampia Collezione Nemotron-Personas, che include risorse simili per paesi come USA, Giappone, India, Singapore, Brasile e Francia. NAVER Cloud ha contribuito con dati iniziali e competenze durante la fase di progettazione. Un tutorial dimostra come implementare un agente coreano utilizzando questo dataset in circa 20 minuti tramite API ospitate, con applicazioni in domini come salute pubblica, finanza ed educazione. L'agente può essere implementato utilizzando NVIDIA NemoClaw, NVIDIA NIM o il catalogo API NVIDIA. I NVIDIA Nemotron Developer Days si terranno a Seoul il 21-22 aprile 2026, con sessioni tecniche e un hackathon focalizzati su IA sovrana e modelli aperti.

Fatti principali

  • Nemotron-Personas-Korea contiene 6 milioni di persone sintetiche basate su statistiche ufficiali coreane
  • Le fonti dei dati includono KOSIS, la Corte Suprema della Corea, il Servizio Nazionale di Assicurazione Sanitaria e l'Istituto Rurale Economico della Corea
  • Il dataset è conforme alla Legge sulla Protezione delle Informazioni Personali (PIPA) della Corea del Sud ed evita informazioni personalmente identificabili
  • È stato generato utilizzando NeMo Data Designer di NVIDIA con un Modello Grafico Probabilistico e Gemma-4-31B
  • Il dataset fa parte della Collezione Nemotron-Personas che copre più paesi
  • NAVER Cloud ha fornito dati iniziali e competenze di dominio durante la progettazione
  • Un tutorial consente di implementare un agente coreano in circa 20 minuti utilizzando API ospitate
  • I NVIDIA Nemotron Developer Days si terranno a Seoul il 21-22 aprile 2026

Entità

Istituzioni

  • NVIDIA
  • NAVER Cloud
  • Korean Statistical Information Service (KOSIS)
  • Supreme Court of Korea
  • National Health Insurance Service
  • Korea Rural Economic Institute
  • AI Singapore
  • WideLabs
  • Pleias

Luoghi

  • South Korea
  • Seoul
  • USA
  • Japan
  • India
  • Singapore
  • Brazil
  • France
  • Jeju

Fonti