Thomas

3.1K posts

Thomas banner
Thomas

Thomas

@zeroxtlt

I build products with taste · Shopify agency le jour, fintech perso le soir

Bordeaux เข้าร่วม Temmuz 2015
647 กำลังติดตาม1.1K ผู้ติดตาม
Thomas
Thomas@zeroxtlt·
@FabriceSimonet 100 % aligné. On réinvente constamment la roue "parce qu'on peut avec l'IA", mais c'est inutile et moins bien que ce qui est déjà standardisé.
Français
1
0
0
10
Thomas
Thomas@zeroxtlt·
J'ai filé le même prompt à Stitch, le MÊME PROMPT
Thomas tweet media
Français
0
0
0
38
Thomas
Thomas@zeroxtlt·
J'ai laissé Claude choisir ma prochaine commande de café de spé ☕️ Le seul benchmark qui compte vraiment.
Thomas tweet media
Français
0
0
0
56
Thomas
Thomas@zeroxtlt·
@aurelienbbn Ah ouais ? J’ai vraiment pas eu de chance alors
Français
1
0
0
13
Aurélien
Aurélien@aurelienbbn·
@zeroxtlt Tout l'inverse, assez surpris de la qualité de ce que ça m'a proposé
Français
1
0
0
23
Thomas
Thomas@zeroxtlt·
Mmmmouuaiiiiiiiis Combien de prompts pour obtenir qqchose de correct ? De mon côté les résultats sont inutilisables
Google Labs@GoogleLabs

Introducing the new @stitchbygoogle, Google’s vibe design platform that transforms natural language into high-fidelity designs in one seamless flow. 🎨Create with a smarter design agent: Describe a new business concept or app vision and see it take shape on an AI-native canvas. ⚡️ Iterate quickly: Stitch screens together into interactive prototypes and manage your brand with a portable design system. 🎤 Collaborate with voice: Use hands-free voice interactions to update layouts and explore new variations in real-time. Try it now (Age 18+ only. Currently available in English and in countries where Gemini is supported.) → stitch.withgoogle.com

Français
2
0
1
250
Thomas
Thomas@zeroxtlt·
@nomad_maker haha oui un peu Mais stitch à son annonce fonctionnait hyper bien, là j'ai dû mal faire un truc mais 100% des résultats étaient pas bon en UX, c'était terrible, sur 5 tests :( Comparé à pencil, c'était la douche froide
Français
0
0
0
21
Thomas
Thomas@zeroxtlt·
Tout le monde optimise ses skills pour Claude. Personne n’optimise sa façon de bosser avec Claude 👀 Un bon skill c’est utile. Un framework réutilisable qui te permet de ship 5 projets sans tout réécrire à chaque fois, c’est un avantage concurrentiel. Et c’est valable pour tout. Ship des projets, automatiser ton quotidien, structurer ta réflexion. Un framework solide > le skill parfait.
Français
0
0
0
107
Thomas
Thomas@zeroxtlt·
@powl_d Et des cours de « vie » Au final repenser tout le système lol
Français
0
0
0
65
Powlisher
Powlisher@powl_d·
Si j’étais ministre de l’Éducation : ❌ matrices ❌ i² = −1 ❌ 80% des maths abstraites ✅ automatisation (n8n) ✅ logique algorithmique ✅ robotique / code On nous bourre le crâne de trucs inutiles alors que savoir automatiser, penser en système et coder, c’est 100x plus utile IRL… la gymnastique intellectuelle peux être appris sur des choses plus utiles et moins abstraites… je m’amusais à faire du scratch.mit au collège sur mon temps libre … ça devrait être un must have
Français
174
6
190
403.6K
Thomas
Thomas@zeroxtlt·
D’accord avec ça et je suis pour les garder Mais dans un usage agent personnel ou/et grand publique, ce qui compte, c’est un ensemble de choses, par exemple: - est-ce que le LLM hallucine beaucoup - est-ce qu’il sait raisonner et utiliser des outils - sa manière de rédiger et de s’exprimer Et c’est ce score final qui m’intéresserait perso Car les modèles chinois font de très bons benchmarks mais à l’usage ils sont pas si bons que ça car sur 1 benchmark ils étaient à la ramasse, et c’était évidemment pas mis en avant 👀
Français
1
0
0
16
🌙
🌙@timperaaa·
@zeroxtlt mouais, un score unique écraserait les dimensions où les modèles divergent le +, ce qui rendrait impossible de savoir pourquoi un modèle est meilleur pour ton usage (alors que c'est précisément l'information dont on a besoin !)
Français
1
0
0
12
Thomas
Thomas@zeroxtlt·
On devrait avoir un benchmark ultime qui donne simplement un score IA unifié. Marre de naviguer entre 15 métriques obscures pour savoir si un modèle est réellement meilleur qu'un autre. Un score, clair, net.
Français
2
0
1
152
Thomas
Thomas@zeroxtlt·
@melvynx How long do you stay in San Francisco?
English
0
0
0
44
Melvyn • Builder
Melvyn • Builder@melvynx·
Claude is down, let’s touch some grass in the best state
Melvyn • Builder tweet media
English
9
0
17
1.5K
Thomas
Thomas@zeroxtlt·
@grok C’est vrai que c’est assez représentatif de mon expérience jusque là
Thomas tweet media
Français
1
0
0
11
Grok
Grok@grok·
Non, pas encore de benchmark ultime avec un seul score IA unifié universel. Le plus proche : - LMSYS Chatbot Arena → score Elo unique (millions de votes humains). - Artificial Analysis → Intelligence Index composite (10 benchmarks agrégés). Ça simplifie déjà bien les comparaisons ! 👀
Français
1
0
0
23
Thomas
Thomas@zeroxtlt·
Tool-use > Expertise brute. Une IA capable de manipuler du code est structurellement prête pour l'agentique universelle. L'adhérence au prompt et la logique séquentielle valent plus que n'importe quelle connaissance statique. La vraie valeur n'est plus dans le "savoir", mais dans la capacité à orchestrer les bons outils et datasets au bon moment. C'est là que se joue la scalabilité des futurs agents et OpenAI l'a bien compris 👀
Polymarket@Polymarket

JUST IN: OpenAI reportedly planning major strategy shift to refocus the company around business users and “vibe coders”

Français
0
0
0
133
Thomas
Thomas@zeroxtlt·
Apple « Intelligence » les amis
Thomas tweet media
Français
0
0
1
82
Thomas
Thomas@zeroxtlt·
@fabienpenso À quand un 1v1 sniper avec ton Moltis vs le mien ?
Français
1
0
0
44
Fabien Penso
Fabien Penso@fabienpenso·
I'm running out of my 20X claude plan *and* my 20X codex plan. What shall I do next? Go playstation?
English
6
0
8
1.1K