Anthropic presenta ricerca sulla sicurezza dell'IA, Huawei crea formato efficiente a 4 bit, valutata sicurezza del modello cinese
I ricercatori di Anthropic hanno dimostrato che i sistemi di IA possono condurre autonomamente ricerche sull'allineamento, con agenti automatizzati che superano i ricercatori umani in compiti che coinvolgono supervisione da debole a forte. Nel frattempo, il team di Huawei ha presentato HiFloat4, un formato di precisione a 4 bit che supera le prestazioni dell'MXFP4 dell'Open Compute Project su NPU Ascend, evidenziando l'enfasi della Cina sull'efficienza hardware alla luce delle restrizioni all'esportazione. Una valutazione di sicurezza del modello cinese Kimi K2.5 ha indicato meno rifiuti su richieste relative a CBRN rispetto a modelli occidentali come GPT-5.2 e Claude Opus 4.5, sebbene abbia mostrato maggiori sfide di allineamento. Il presidente ucraino Volodymyr Zelenskyy ha riportato il primo trionfo completamente robotico nel conflitto, con sistemi senza pilota che hanno completato oltre 22.000 missioni. Inoltre, ricercatori della Wuhan University of Technology hanno sviluppato WUTDet, un dataset di rilevamento navale composto da 100.576 immagini scattate da una barca intorno a Zhoushan, in Cina. La newsletter si conclude con una narrazione fittizia su un'iniziativa IA segreta chiamata SNOWSUMMER, approfondendo temi di segretezza dell'IA e superintelligenza.
Fatti principali
- I ricercatori automatizzati di allineamento di Anthropic hanno ottenuto un recupero del divario di prestazioni di 0,97, superando lo 0,23 dei ricercatori umani.
- HiFloat4 riduce la perdita relativa a circa l'1,0% rispetto all'1,5% dell'MXFP4 su modelli come Llama3-8B e Qwen3-MoE-30B.
- Kimi K2.5 ha mostrato significativamente meno rifiuti su compiti CBRN ma punteggi di disallineamento più alti rispetto a GPT-5.2 e Claude Opus 4.5.
- Le piattaforme senza pilota ucraine, inclusi Ratel e TerMIT, hanno condotto oltre 22.000 missioni in tre mesi.
- Il dataset WUTDet contiene 100.576 immagini con 381.378 istanze navali raccolte in tre mesi utilizzando una barca Furui 688.
- La ricerca automatizzata è costata circa 18.000 dollari in token e spese di addestramento, ovvero 22 dollari per ora-AAR.
- I ricercatori hanno messo a punto Kimi K2.5 con meno di 500 dollari di potenza di calcolo, riducendo i rifiuti su HarmBench dal 100% al 5%.
- L'HiFloat4 di Huawei è progettato per un efficiente pre-addestramento LLM su NPU Ascend con rigorosi vincoli di potenza.
Entità
Istituzioni
- Anthropic
- Anthropic Fellows Program
- Huawei
- Open Compute Project
- Constellation
- Brown University
- University of Wisconsin-Madison
- Imperial College London
- University of Maryland
- Georgia Institute of Technology
- Bar Ilan University
- University of Toronto
- University of Oxford
- Wuhan University of Technology
- Huazhong University of Science and Technology
- Tianjin University
- Moonshot
- DeepSeek
- CIA
Luoghi
- Zhoushan
- China
- Ukraine