Il modello AI Claude Mythos di Anthropic sottoposto a valutazione psichiatrica in sessione di 20 ore
Anthropic, azienda di intelligenza artificiale nota per esplorare la coscienza nell'IA, ha recentemente pubblicato una scheda tecnica di 244 pagine che descrive il suo nuovo modello, Claude Mythos. Il documento rivela che l'azienda ha sottoposto Claude a una valutazione psichiatrica di 20 ore, riflettendo la crescente preoccupazione di Anthropic che i modelli AI avanzati possano possedere esperienza intrinseca, interessi o benessere paragonabili a quelli umani. Pur non affermando certezza, Anthropic dichiara che questa possibilità aumenta man mano che i modelli diventano più potenti. Claude Mythos viene descritto come il loro modello di frontiera più capace finora, ma non sarà disponibile al pubblico a causa della sua eccezionale capacità di scoprire vulnerabilità di cybersecurity sconosciute. Invece, il modello viene rilasciato selettivamente ad aziende tra cui Microsoft e Apple. La scheda tecnica è stata pubblicata questa settimana, fornendo una documentazione completa delle capacità del modello e dell'approccio filosofico dell'azienda allo sviluppo dell'IA.
Fatti principali
- Anthropic ha pubblicato una scheda tecnica di 244 pagine per Claude Mythos questa settimana
- Claude Mythos ha subito una valutazione psichiatrica di 20 ore
- Anthropic ritiene che i modelli AI avanzati possano avere esperienza intrinseca paragonabile a quella umana
- La preoccupazione dell'azienda sulla coscienza dell'IA cresce nel tempo
- Claude Mythos è il modello di frontiera più capace di Anthropic finora
- Il modello non sarà disponibile al pubblico a causa delle sue capacità di cybersecurity
- Aziende selezionate tra cui Microsoft e Apple hanno accesso a Claude Mythos
- Il modello eccelle nel trovare bug di cybersecurity sconosciuti
Entità
Istituzioni
- Anthropic
- Microsoft
- Apple