
Olivier Depiesse
22.3K posts

Olivier Depiesse
@carismarus
CTO @WebediaFR, web pioneer since '98. Passionate about AI, DeFi, Web3 and decentralization.
Cordoue, Espagne Katılım Ocak 2008
1.7K Takip Edilen1.2K Takipçiler

@antonello Y se lo guardan para ellos para mejorar sus productos y ganar ventaja sobre sus competidores. Es tremendo ver con qué frecuencia lanzan nuevas funcionalidades mientras los demás parecen estar estancados. A ver cómo reacciona Google en la I/O en 10 días...
Español

La gente de METR he evaluado una versión temprana de Claude Mythos y tremendo puñetazo encima de la mesa.
METR mide capacidades de modelos IA estimando la duración de las tareas técnicas que puede resolver con cierta probabilidad de éxito, comparándolas con cuánto tiempo tardaría un humano experto en completarlas.
Según lo que acaban de publicar: Claude Mythos Preview casi se sale de las gráficas porque se estima que puede completar correctamente la mitad de las veces tareas de software que a un humano experto le llevarían al menos unas 16 horas.
Como explica METR en el post y como podemos ver jugando con las gráficas, Claude Mythos alcanza un horizonte temporal de unas 3 horas en el criterio del 80%, es decir, podría completar correctamente 8 de cada 10 veces tareas de software que a un humano experto le llevarían aproximadamente 3 horas.
Con las salvedades que tiene Metr (en mi opinión hay un problema clásico y es que los problemas y tareas de benchmarks son demasiado limpios y bien definidos; a eso hay que sumar que tienen pocas tareas por encima de 16 horas y empiezan a estar saturados) y teniendo en cuenta escala logarítmica que es más espectacular (pero muestra mejor el progreso de los modelos)...
... creo que cabe concluir que Mythos no era sólo hype sino que Anthropic tiene un buen bicho ahí guardado.
metr.org/time-horizons/

Español
Olivier Depiesse retweetledi

Ok, something awesome just happened.
Someone genius, in France, @romainsimon (bravo), created skills for AI agents specialized in "paperasse" (= French paperwork bureaucracy).
I opened Codex, and it did all my taxes. Like for real
Even more, instead of a hellish chore, it was fun?
Triple checked everything (yeah you never know) and it was 100% correct
The bonus: with Browser Use, codex filled all the cells on the Taxes website. Surreal

English

Propriétaires en 2006 :
“400 € de loyer, 250 € de caution. T’as un boulot ? Parfait, voilà les clés.”
Propriétaires en 2016 :
“850 € de loyer, 850 € de caution… et on va dire deux mois de garantie. C’est déjà une affaire, ne discute pas.”
Propriétaires en 2026 :
“Alors voilà comment ça se passe —
• 1 200 € de loyer
• 2 mois de caution (on va faire simple)
• Dossier béton exigé
• CDI obligatoire (période d’essai ? oublie)
• Garant physique + garant moral + garant spirituel
• Revenus minimum 3 fois le loyer (mais on préfère 4)
• Pas d’animaux. Pas d’enfants. Pas de bruit. Respire doucement.
• 6 justificatifs, 3 fiches de paie, ton avis d’imposition, ton ADN
• Enquête de voisinage + vérification de ton existence
Appartement :
Moquette qui a connu les franc
Frigo qui fait un bruit chelou à 3h du matin
Plaques qui chauffent… quand elles veulent 🙄😭
Français

@CTRBooster75 C'est facile que Google t'indexe en réalité, le souci c'est de garder tes pages indexées sur la durée, et surtout que des vraies personnes aillent sur ton site.
Français

Internet est mort.
Sérieux, regardez où on en est. Des milliers de sites programmatiques générés avec Claude Code, balancés en pagaille, qui squattent les SERP
Et Google ? Aux abonnés absents. Aucune sanction, aucun filtre, ils indexent tout
C'est devenu une déchetterie
D'ailleurs voici la mienne 🤣


Français

Hoy doy una conferencia en una universidad de informática sobre IA y el momento e impacto en ingeniería software.
Pues bien, casi les resumiría que lo que tienen que leer y entender es el post del CTO de Mercadona, Pérez Agüera, sobre cómo han construido su propio buscador para la tienda online.
Les diré que aunque la explicación técnica es estupenda, se fijen en cómo piensa el problema y cómo valoran la decisión:
El buscador es la puerta principal de una tienda online. Mercadona maneja 4,4 millones de búsquedas semanales, y un 4% sin resultados equivalía a 176.000 usuarios frustrados por semana.
Construir el buscador propio les dio control sobre el ranking, mejora dirigida con datos reales, propiedad del conocimiento y una fracción del coste de un SaaS.
Cómo han pensado las métricas para valorar si hay mejora, cómo es que aunque haya mucho Claude Code para la productividad del desarrollo, el criterio humano guía, valora, retroalimenta, controla y entiende el prooceso completo. Cómo con IA la ecuación entre "construyo solución o tiro de un saas que lo haya hecho", cambia.
Un punto extra, el CTO de Mercadona defiende la filosofía de compartirlo como un valor de la empresa.
En mi opinión es un regalazo: como decía @antor en un episodio de monos estocásticos, ahora mismo está todo el mundo inventando la forma de trabajar con inteligencia artificial agéntica en desarrollo. Mostrar estos casos de éxito eleva a todo el sector.
Mis dieses, gemba.es/p/como-constru…

Español

@charliesbot Usa Sonnet con Opus en /advisor. Problema solucionado.
Español

La última semana he odiado Claude / Claude Code con ganas
El modelo Opus 4.7 es lentisimo y me toca seguido que me da resultados mediocres y paso más tiempo iterando en la etapa de investigación
Al punto en que me la estoy pensando seriamente en revisar que tal Codex 👀
Está es la razón por la que recomiendo no pagar suscripciones anuales: para poder revisar más modelos
Español
Olivier Depiesse retweetledi

@gen_axis_gen I played on Super Famicom as a kid but don't remember it that difficult. Was it that hard for real?
English

FinalFantasy6がいかに多くの人に愛されてきたのか。
ゲームの投稿をする度に実感します。
そして自分自身も最高のゲームだと改めて思います。
クライマックスに近づくのを実感する度に寂しくなりますが、皆さんに楽しんでもらえる投稿をしていきたいと思います。
ところで、スーファミ版ってのはとてつもなく難しかったのではないでしょうか?
デスゲイズは見えない、マッシュのコマンドも見えない。それだけでもかなり体感難易度変わりそうです。
弦 | GEN@gen_axis_gen
なんじゃこりゃーーーーー!!?? FF6、世界崩壊後にファルコン号を浮上させたらやばいもの発見!! 何この時空の歪みみたいなやつ! 悪い予感しかしないけど、危険なやつですよね?
日本語
Olivier Depiesse retweetledi

The situation in Spain where LaLiga can force ISPs to ban any IP range they want without a court order is ridiculous and so aggressively anti-internet that it's causing real harm to Spain's citizens.
Docker is one thing, but the other comments in this HN post are way worse (anti-theft alarms, apps for helping people suffering from dementia). It's horrible that clouds that serve multiple sites from the same IPs are being strong-armed into either taking down anything LaLiga wants without a court order or suffering mass ip blocks.
Theo - t3.gg@theo
Spain's egregious Cloudflare blocks are breaking Docker now 💀
English

@Pauline_Cx @feedbask_com Probably I guess, also structure and interlinking is important, as the main topic. But Google is smart, even after a good start, it can desindex all your content. I've been there before.
English

@carismarus @feedbask_com You added hundreds, I added thousands, maybe that's the difference?
English

Small win of the day, but means a lot: 3 pages indexed.
Actually, we've been struggled with @feedbask_com SEO for months.
Google indexed only one page.
I think we made a mistake with programmatic SEO a few months ago and Google punished us.
So now I see we have three pages instead of one, I'm quite positive and optimistic we can do it and start to get more pages indexe

English

Demain je vous fais un premier retour sur le combo Hermes Agent + Codex
Les use cases, les plus, les moins…
En un week-end il y a déjà des choses à dire ahah
Nekr@0xNekr
👋, Après le down d'Openclaw via la sub Anthropic je vais tester Hermes avec Codex derrière, Je vous ferai un retour, Le but est d'avoir un couteau suisse de poche, direct dans Telegram, comme l'était Openclaw, C'est l'occasion de tester un nouvel outil !
Français

@impeccable_ai Are the removed commands still working with some kind of retro compatibility? I have them inserted in subagents and issues.
English

We heard you: 21 commands was too many, and some felt duplicative.
v2.1 consolidates to 18 without loss of functionality:
/arrange -> /layout (clearer name)
/normalize -> /polish (design system alignment is now part of the final pass)
/onboard -> /harden (empty states and first-run are part of production readiness)
/extract -> /impeccable extract (sub-mode, like craft and teach)
also, deprecated files/skills now clean up automatically on the next load of the /impeccable main skill.
best way to update:
npx impeccable skills update
we'll be consolidating more aggressively in the future to land way below ~5 total skills - stay tuned!
English
Olivier Depiesse retweetledi

OpenAI vient de lancer une offre à 100 dollars par mois, entre le Plus à 20 et le Pro à 200, ciblé sur les développeurs Codex avec cinq fois plus d'usage que le plan Plus.
On est en train de construire sans le dire, un marché à deux IA.
D'un côté les plans gratuits et bon marché, avec des modèles dégradés et des quotas minimum, qui donnent l'impression que l'IA est utile mais limitée. De l'autre les plans à 100 ou 200 dollars, où les modèles sont vraiment capables et l'expérience suffisamment transformatrice pour changer la façon de travailler. Et ça change tout...
Le problème c'est que le débat public sur l'IA se base sur la première offre. Les journalistes qui couvrent le sujet depuis leurs comptes gratuits. Les régulateurs qui ont vu une démo. Les élus qui ont entendu que ChatGPT hallucine.
Pendant ce temps, ceux qui paient 100 ou 200 dollars par mois vivent dans une réalité technologique que le reste du monde est en train de discuter sans l'avoir vraiment expérimentée.
The Verge@verge
ChatGPT has a new $100 per month Pro subscription theverge.com/ai-artificial-…
Français

@thismacapital OpenAI va facturer au nombre de tokens l'usage de tokens, et Anthropic va finir par faire pareil...
Français

Je viens de prendre un abonnement supplémentaire OPENAI 200$ codex pour pouvoir être illimité sur mon openclaw car je peux plus vivre sans aujourd'hui
Donc pour le dev : claude code 200$
Pour l'agentic : codex 200$
Je pense que si y'a un abonnement plus complet max de Claude Code je le prendrai même à 1000$ par mois c'est tellement rentable en terme de temps
Français



