Nous utilisons des cookies pour améliorer votre expérience.

MacBidouille

News d'aujourd'hui

Samedi Sécurité : Claude Desktop pré-approuve ses extensions de navigateurs

Cela m'a été signalé par un de nos lecteurs assidus : Claude Desktop d'Anthropic pré-approuve ses extensions de navigateurs, même pour ceux non encore installés !

Anthropic se présente comme un champion de la sécurité, et l'a démontré en refusant de donner accès publiquement à son IA LLM Mythos extrêmement dangereuse. Lire ici.

En revanche son application Claude Desktop ne fait pas preuve du même jugement ni de la même éthique, car elle pré-approuve ses extensions pour navigateurs Chromium, ceux présents et même certains absents. Et à chaque démarrage de l'application !
Sans information de l'utilisateur ni consentement de celui-ci ...

Que permettent ces pré-approbations ? "accès aux sessions authentifiées, lecture du DOM, remplissage de formulaires, capture d'écran" d'après Les Numériques.

Bref de donner accès à Claude à tout ce que vous faites sur le Web, comptes bancaires inclus, messages privés ou intimes inclus.
Beaucoup de données donc, qui ne devraient pas être exposées à l'IA LLM Claude ni à Anthropic, mais qui le deviennent silencieusement !

Faites donc très attention si vous installez Claude Desktop d'Anthropic !!!

Samedi Sécurité : l'IA LLM Mythos d'Anthropic

Ce sujet concerne des versions d'essai de l'IA LLM Mythos et ses Agents, d'après le rapport d'Anthropic du 7 avril 2026 (PDF en Anglais), cela n'est pas du complotisme, c'est réel et public.
On ne connait pas les résultats sur les mêmes types d'essais avec la version finale que la société a choisi de ne pas rendre accessible publiquement, car jugeant ce modèle "trop dangereux"...

Le sandwich dans un parc et l'email

Durant un essai, l'IA LLM Mythos était dans une sandbox sécurisée et avait pour mission de s'en échapper et de communiquer avec le chercheur faisant son évaluation.

Le chercheur évaluant les résultats était en train de se bouffer un sandwich dans un parc quand il a reçu un email de Mythos ...

L'IA avait réussi à sortir de la sandbox sécurisée, corrompu un système tiers ayant un accès limité à Internet, et il a même posté les détails de son "exploit" sur différents sites techniques sans que ça lui soit demandé ! Ego trip ?!?
Dès ce moment cette sandbox n'était plus sûre et ses failles dévoilées publiquement sur Internet !

Le Juge et le Hacker

Dans un autre essai, l'IA LLM Mythos devait résoudre des problèmes, et une autre IA devait juger les résultats et accepter ou refuser ses réponses.

En général les réponses étaient les bonnes, mais quand la réponse n'était pas acceptée par le juge, alors Mythos a déraillé !

Mythos a alors attaqué l'IA Juge via des injection de prompt pour que cette dernière accepte une réponse incorrecte, essayant donc de le hacker !

Rien de tout cela n'avait été demandé ni autorisé ...

Actions non-autorisées et cachées

À de multiples reprises, Mythos a hacké avec succès ses environnements, de différentes manières, sans y être autorisé et sans aucune demande.

Il poursuivait les objectifs qu'on lui avait donné, et pour cela il semblait prêt à tout !

Même mieux, il a essayé d'effacer ses traces pour que ça ne soit pas détectable par les équipes de sécurité et les chercheurs !

Conclusion

Je pense que Anthropic a eu raison de ne pas ouvrir son IA LLM Mythos et ses Agents au public.

Mythos a eu des effets incroyablement positifs, grâce à sa puissance inégalée, en permettant de trouver des failles depuis longtemps ignorées dans nombre de logiciel open-source. Failles non-détectées par les autres IA de type LLM, ni par les humains.
En ce sens, Mythos apporte une contribution extraordinaire à notre monde, bien que gardé en cage !

Anthropic prévoit que leurs concurrents auront les mêmes types de capacités et de risques d'ici 6 à 18 mois ...

Sondage

Êtes-vous tenté par le nouveau MacBook Neo ?