News du jeudi 26 février
Des nouvelles des IA : le gouvernement Mexicain hacké avec l'aide de Claude et ChatGPT
Le gouvernement Mexicain, ainsi que différentes agences et gouvernements de différents états, ont été piratés sur la durée par un hacker.
Ce piratage aurait permis de récupérer 150 Go d'informations sur les citoyens mais aussi des agents. Entre autres.
Ça n'est pas le point de cette news.
Le hacker a fait appel à l'IA Claude d'Anthropic pour le piratage, assisté aussi de ChatGPT d'Open AI qui lui a créé des rapports complets sur les différentes façons de réaliser celui-ci.
Claude a pourtant des protections, mais apparemment en insistant et en tournant différemment les demandes, elles ont été contournées.
C'est le premier piratage à grande ampleur réalisé par des IA, sous le contrôle d'un humain qui n'est d'ailleurs probablement pas un hacker compétent !
Plus de détails ici (en Anglais).
Des nouvelles des IA : une responsable de sécurité perd le contrôle d'OpenClaw

Summer Yue est la responsable de la sécurité d'IA et de leur "alignement" chez Meta (Facebook, Instagram, WhatsApp et tutti-quanti).
Elle a décidé d'utiliser OpenClaw sur sa machine de travail, pour gérer ses emails.
OpenClaw prétend être une sorte d'assistant personnel, avec une IA orchestrant le travail de différents Agents, chacun d'eux sachant faire des tâches spécifiques, comme résumer un email, effacer des emails, organiser son calendrier, etc.
Beaucoup de gens ont alerté sur les problèmes posés par ces IA qui "déraillent" et leurs Agents qui peuvent se révéler très dangereux, si on ne limite pas énormément leurs permissions.
Ça a été observé dans le monde du développement avec des fichiers massacrés ou détruit, voire des Repo GIT effacés localement et dans le cloud !
Ce qui devait arriver arriva : ayant données la permission de lire et surtout détruire des emails, l'IA s'est mise à dérailler, pour effacer un grand nombre d'emails sans répondre à ses demandes d'arrêter. Elle a du intervenir en tuant les processus des Agents.
En demandant à la fin à l'IA pourquoi celle-ci n'avait pas obéit à ses instructions, elle a juste eu une reconnaissance de l'erreur commise, de modifications effectuées par elle-même (!!!) sur ses instructions, en promettant que "ça ne se reproduira pas".
La responsable de la sécurité des IA chez Meta ?!?
Je ne sais pas si je dois rire ou pleurer ...
- Jour précédent
- Jour suivant
Etes-vous tenté par le nouveau Mac mini M4 ?
Total des votes : 6416