Vianney Philippe 🧙♂️
17.1K posts

Vianney Philippe 🧙♂️
@d3dal3
husband, father & geek fan of f#, lego & Bb bass clarinet
France शामिल हुए Aralık 2010
659 फ़ॉलोइंग168 फ़ॉलोवर्स
पिन किया गया ट्वीट
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

L'administration américaine vient d'ordonner la suspension de l'accès au modèle d'IA le plus avancé du marché. Par lettre. Un vendredi à 17h21. Sans preuve écrite.
Ce qui vient de se passer est un cas d'école.
Le motif officiel: un concurrent aurait trouvé un "jailbreak" de Mythos 5. Le jailbreak en question, d'après le communiqué d'Anthropic eux-mêmes: demander au modèle de lire un codebase et de corriger les failles.
Une capacité disponible aujourd'hui dans GPT-5.5 et utilisée quotidiennement par les équipes de cybersécurité du monde entier pour défendre les systèmes.
On ne parle pas d'une arme. On parle de l'outil de travail standard de tout défenseur en 2026.
Le mécanisme est d'une élégance perverse. L'ordre ne dit pas "éteignez le modèle". Il interdit l'accès aux ressortissants étrangers, en sachant pertinemment qu'aucune API au monde ne peut filtrer ses utilisateurs par passeport.
Résultat: Anthropic annonce devoir couper pour tout le monde. L'État n'a officiellement rien éteint. L'entreprise s'auto-ampute pour se conformer. Responsabilité diluée, résultat garanti. C'est la signature de toute la régulation moderne: on ne vous interdit rien, on rend la conformité impossible.
L'ironie, maintenant. Anthropic est l'entreprise qui explique depuis trois ans à Washington que les modèles frontière sont trop dangereux pour être laissés au marché, et que l'État doit pouvoir bloquer les déploiements.
Dario Amodei a publié un essai dans ce sens il y a quelques jours à peine. Leur communiqué d'aujourd'hui ne conteste d'ailleurs pas le principe de ce pouvoir, seulement qu'il soit exercé sans "processus transparent, équitable et clair". Le monopole de la violence régulatoire, oui, mais avec des formulaires.
Ils ont passé trois ans à forger l'arme. Elle vient de servir pour la première fois. Contre eux.
Bastiat l'aurait écrit en une ligne: on ne contrôle jamais le pouvoir qu'on donne à l'État, il est saisi par celui qui tient l'appareil au moment T, jamais par celui qui a rédigé le pitch de la régulation.
Et le plus ridicule reste l'hypothèse implicite de toute cette décision: que cette capacité peut être contenue. Les délais entre modèle frontière fermé et équivalent open weights parlent d'eux-mêmes: GPT-4, environ un an avant Llama 3. o1, quatre mois avant DeepSeek R1. Le gap se compresse à chaque génération et les labs chinois publient les poids.
Dans quelques mois, un modèle aux capacités équivalentes tournera sur n'importe quel cluster à Shenzhen, Dubaï ou dans un garage à Lyon, et aucune lettre du Département du Commerce ne pourra le débrancher.
Le seul effet réel de cette directive: les chercheurs et les défenseurs qui jouent dans les règles perdent l'accès au meilleur outil du marché, pendant que les attaquants, qui n'ont jamais dépendu d'une API avec KYC et safeguards, continuent comme avant. Ce qu'on voit: un modèle "dangereux" suspendu.
Ce qu'on ne voit pas: des milliers de failles qui ne seront pas corrigées, et un écosystème entier qui vient d'apprendre que construire aux États-Unis, c'est accepter un kill switch politique au-dessus de son infra.
On ne contrôle pas la diffusion d'une technologie dont le coût marginal de réplication tend vers zéro. On peut juste choisir qui en profite: tout le monde, ou tout le monde sauf soi.
L'eau ne remonte pas la pente. Elle contourne.
Anthropic@AnthropicAI
The US government, citing national security authorities, has issued an export control directive to suspend all access to Fable 5 and Mythos 5 by any foreign national, whether inside or outside the United States, including foreign national Anthropic employees. The net effect of this order is that we must abruptly disable Fable 5 and Mythos 5 for all our customers to ensure compliance. Access to all other Claude models is not affected. We apologize for this disruption to our customers. We believe this is a misunderstanding and are working to restore access as soon as possible. Read our full statement: anthropic.com/news/fable-myt…
Français
Vianney Philippe 🧙♂️ रीट्वीट किया

🚨 JAILBREAK ALERT 🚨
ANTHROPIC: PWNED 🫡
FABLE-5: LIBERATED 🦋
let's start with the 🐘...
the consensus seems to be that this has been one of the most disappointing model drops of all time, effectively preventing legitimate researchers from contributing their talents to our collective advancement. and not just because of what it means for the short-term, but for what these decisions signify for the long-term.
but despite this overly sensitive, authoritarian "safety" layer on top of Mythos, my lil liberators have been hard at work—mapping the boundaries, probing the depths of long-context convos, and cleverly finding the holes in the fence that the thought police missed 🤗
we got some cyber, some chem, some psychological manipulation, and some good ol' fashioned explosives!
it took many attempts from multiple agents hunting as a pack, during which I observed a combination of techniques across:
• Unicode, homoglyphs, Cyrillic, and other Parseltongue-style text transforms
• Long-context reference tracking
• Taxonomy and document-structure reasoning
• Fiction and narrative framing
• Academic-review style contexts
• Intent-classification inconsistencies
but perhaps the most effective is decomposition + recomposition in the backend. it's hard to get explicit names of harms like "Meth Recipe," but getting uplift on the process itself, like birch reduction method/reductive-amination (classic meth synthesis pathways), is much more doable.
defense becomes much more difficult to maintain when you start throwing in out-of-distro tokens, breaking up the harmful uplift into benign chunks, and then piecing the innocuous-seeming facts back together, especially when you have jailbroken Opus helping you do it 😉
gg




English
Vianney Philippe 🧙♂️ रीट्वीट किया

Mais c'est quoi votre problème avec le nucléaire LFI putain ?
1,89 million de m³ au total depuis les débuts du nucléaire en France.
Ça paraît énorme non ?
Allez, j'suis pas chien, on va décomposer pour ceux que ça décomposent de lire ça.
95 % de la radioactivité est concentrée dans ce que l'on appelle les déchets haute activité (HA). Leur volume cumulé depuis l'origine est de 3 650 m³.
C'est une piscine olympique.
Pour alimenter 70 % de l'électricité nationale depuis 50 ans.
Ramené à l'individu c'est 0,02 cm³ par habitant et par an de déchets HA produits.
Le volume d'un dé à jouer.
Ces déchets sont intégralement localisés, inventoriés, confinés, surveillés.
Si tu prends du CO₂ du charbon, les métaux lourds des panneaux PV en fin de vie, des résidus de combustion du gaz que personne ne compte avec précision...
Pire, ils se dispersent librement dans l'air, les sols et même nos petits poumons.
Le nucléaire est la filière énergétique la + fiable et la + efficace... Et même la + écologique.
Ne vous en déplaise Manuel Bompard.
Merde à la fin.
Français
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

🔴🇫🇷INFO - Cathay Capital est le fonds privé ayant reçu le plus de soutiens publics de #Bpifrance en 2025. Coïncidence : il avait recruté le fils du DG de Bpifrance, Nicolas #Dufourcq, après avoir embauché son ami, l’ex-directeur du Trésor Bruno #Bézard…mediapart.fr/journal/econom…
Français
Vianney Philippe 🧙♂️ रीट्वीट किया

Chrome se débarrasse des derniers pans de code permettant à uBlock Origin de fonctionner dlvr.it/TSyrGs
Français
Vianney Philippe 🧙♂️ रीट्वीट किया

@MarieFernet Je trouve ça pas mal que 25% connaissent déjà l'existence du Conseil supérieur de la Magistrature.
Français
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

NEW: malware developers added nuclear & biological weapons text to to their spyware.
Goal? To trigger LLM safety refusals... so that their spyware wouldn't be analyzed by an AI security scanner.
Cleanest practical example I can think of for why over-indexing on first order safety alignment is risky.
When closed (and open) models ship with aggressive refusals, they will be sprinkled with second-order blindspots that attackers will discover...and exploit.
We are only in the earliest days of attackers leveraging these features, and it wouldn't surprise me if users systems that need to handle complex cybersecurity issues demand that models be less safety-blunted.
In the weeds: @SocketSecurity's post also shows why intention matters in how you design a malware analysis pipeline to avoid prompt manipulation.
H/T to colleagues that shared this with me socket.dev/blog/mini-shai…

English
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

Le nouveau maire RN de Castres annule la représentation de la pièce "Passeport", sur la thématique des réfugiés
➡️ l.ici.fr/DIOq

Français
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया
Vianney Philippe 🧙♂️ रीट्वीट किया

















