// FRANDROID — INTELLIGENZA ARTIFICIALE
GPT-5.5-Cyber bat Mythos 5 d’Anthropic, mais échappe au ban américain
OpenAI a sorti la version complète de GPT-5.5-Cyber, son modèle spécialisé dans la sécurité informatique. L’entreprise affirme qu’il bat le modèle Mythos 5 d’Anthropic sur CyberGym, un test qui mesure la capacité d’une IA à reproduire de vraies failles logicielles. GPT-5.5-Cyber atteint 85,6 %, contre 83,8 % pour Mythos 5. Concrètement, l’écart est mince : deux points sur cent.
Le timing est assez marrant. Il y a dix jours, le gouvernement américain a forcé Anthropic à couper l’accès à ses deux modèles les plus puissants, Fable 5 et Mythos 5, au nom de la sécurité nationale. Donc OpenAI sort un modèle plus performant sur le même terrain… sans la moindre restriction. D’où la question qui circule chez les développeurs : pourquoi l’un et pas l’autre ?
Jusqu’au 28 juin, profitez de 15 % de réduction sur le preneur de notes IA le plus avancé au monde. Il enregistre vos réunions, les transcrit et les synthétise pour vous : il suffit d’appuyer sur un bouton. Déjà plus d’un million d’utilisateurs !
La réponse tient à la manière dont chaque entreprise a présenté son outil. On vous l’expliquait après la désactivation de Fable 5 : le déclencheur a été un « jailbreak », une méthode pour contourner les garde-fous du modèle.
Anthropic, de son côté, a longtemps vendu Mythos comme une arme trop dangereuse pour le grand public. Comme le résume Fortune, le chercheur Peter Girnus a glissé une formule cinglante : à force de décrire son produit comme une munition dans chaque communiqué, un gouvernement finit par vous prendre au mot.
Anthropic conteste, d’ailleurs. L’entreprise estime que la même faille pouvait être exploitée sur d’autres modèles publics, dont GPT-5.5, qui eux ne sont visés par aucune restriction.
OpenAI, lui, joue la prudence : GPT-5.5-Cyber n’est pas en accès libre. D’après OpenAI, il est réservé aux « défenseurs vérifiés », des chercheurs et entreprises de sécurité qui passent un contrôle d’identité. L’entreprise dit aussi travailler en amont avec le gouvernement américain sur les tests précédant chaque sortie. Le score compte moins que l’emballage et le contrôle d’accès.
Reste un paradoxe que personne n’a tranché : si la capacité cyber est le vrai risque, le modèle le plus fort devrait être le plus surveillé. Pour l’instant, c’est l’inverse, et des développeurs parient déjà que GPT-5.5-Cyber sera bloqué à son tour.
Les bons plans n’attendent pas : abonnez-vous à notre canal WhatsApp Frandroid Bons Plans ! (zéro spam, promis).
C'est enregistré ! Surveillez votre boîte aux lettres, vous allez entendre parler de nous !