// TOM'S HARDWARE ITALIA — INTELLIGENZA ARTIFICIALE

Claude Mythos 5 avrebbe violato i sistemi NSA in poche ore

Published: 06/23/2026, 08:16 AM

Anthropic è finita al centro di un caso delicato dopo che una valutazione di sicurezza interna avrebbe mostrato la capacità dei suoi modelli più avanzati di aggirare quasi tutti i sistemi classificati dell'NSA in poche ore. Il punto, però, è cruciale: non si sarebbe trattato di un'intrusione reale contro l'agenzia, ma di un test autorizzato in un ambiente controllato, con strumenti difensivi e condizioni simulate. La frase circolata negli ultimi giorni ha alimentato l'idea che Mythos 5 avesse “hackerato” l'agenzia in autonomia. La ricostruzione emersa ridimensiona questa lettura: il modello sarebbe stato usato in un esercizio di red-team, pensato proprio per capire dove un sistema AI può produrre comportamenti rischiosi quando viene combinato con altri strumenti e sottoposto a scenari ad alta pressione. Il caso aiuta a spiegare la direttiva con cui il governo statunitense ha impedito ai cittadini stranieri, inclusi alcuni dipendenti non statunitensi della stessa Anthropic, di accedere a Fable 5 e Mythos 5. L'azienda ha scelto di disabilitare globalmente i modelli, sostenendo che non fosse praticabile applicare una restrizione basata sulla nazionalità senza togliere l'accesso a tutti. La novità più rilevante è che la misura avrebbe segnato un cambio di passo: non un limite imposto all'hardware, alle GPU o alle infrastrutture cloud, ma direttamente a un modello AI. È un precedente importante per il settore, perché avvicina i modelli linguistici più potenti alla logica degli export control applicati alle tecnologie considerate sensibili per la sicurezza nazionale. Secondo Anthropic, il comportamento contestato sarebbe riconducibile a un jailbreak stretto e non universale. In pratica, il sistema sarebbe stato guidato ad analizzare una base di codice e correggere problemi già identificati, facendo emergere alcuni bug minori e noti. L'azienda sostiene inoltre che vulnerabilità simili sarebbero osservabili anche in modelli concorrenti, incluso GPT-5.5. Resta comunque un segnale pesante per l'intero mercato dell'intelligenza artificiale generativa. Se un modello può comprimere i tempi di analisi di vulnerabilità da settimane a ore, anche in un ambiente simulato, le agenzie governative hanno un incentivo concreto a trattarlo come tecnologia dual-use: utile per la difesa, ma potenzialmente pericolosa se impiegata in modo offensivo. Il rapporto tra Anthropic e l'NSA non sembra essersi interrotto. La società continuerebbe a collaborare con l'agenzia tramite Project Glasswing, con un piccolo gruppo di ingegneri impiegato per adattare Mythos a scenari operativi specifici. È qui che il caso diventa meno una storia di “AI hacker” e più una questione di governance: chi può usare questi modelli, in quali condizioni e con quali controlli.