Melina
2.9K posts


@Kekius_Sage On est dans un espace à 3 dimension mais on existe dans un "point orienté "d'une dimension temporelle 1
Français

@thismacapital L'AGI réutilise pas l'argent "qu'elle gagne" dans le circuit économique humain. Y a un transfert monétaire à sens unique. Bizarre que personne ne tire la sonnette d'alarme, la douille arrive et elle est énorme
Français

Post-IA l'argent n'aura plus aucune valeur car la première société qui va craquer l'AGI aura un pouvoir qui n'a jamais été égalé dans l'histoire de l'humanité
C'est pour ça qu'OpenAI va bientôt se trader à 1000 milliards de capitalisation : les investisseurs ont compris que l'argent n'est que le fuel pour sortir d'orbite
Plus on injecte plus on calcule plus on attire les talents et plus on s'approche du but final
Français

@LeNoobCodeur Avec simplement Nano Banana j' ai vu un mec faire de l'argent. Il propose une appli qui fait des selfies à des dames aux USA où elles peuvent changer leurs coiffures sur demande sur la photo.
Il a juste ergonomisé le truc pour des non initiés qui payent 30 $ le truc
Français

Vraie question, pas de troll :
Y'a quelqu'un ici qui fait VRAIMENT de l'argent avec #OpenClaw ?
Pck j'ai creusé... en vrai j'ai trouvé beaucoup de bruit et pas beaucoup de signal.
Le cas le plus cité c'est Nat Eliason — $80k en 30 jours. Sauf que le mec a déjà des centaines de milliers de followers et il vend un info product. C'est pas OpenClaw qui génère, c'est son audience + le hype autour du bot.
L'autre c'est Oliver Henry — "$4000 en 24h". Tu lis le thread en entier... une bonne partie vient d'un meme coin. Le vrai recurring c'est ~$588/mois. C'est plus honnête mais c'est pas le truc de ouf qu'on te vend.
Après t'as les mecs qui font du setup-as-a-service, du consulting, des formations, des skills sur ClawHub. Ok ça marche... mais c'est pas "gagner de l'argent avec OpenClaw". C'est vendre la pelle aux chercheurs d'or.
Et le seul use case vraiment technique c'est un bot d'arbitrage Polymarket qui exploite un lag de quelques minutes. C'est malin. Mais c'est du trading.
L'outil est puissant c'est pas la question. La question c'est : est-ce que quelqu'un fait du vrai récurrent avec, sans vendre une formation ou un service autour ?
Si t'as un cas concret je suis sincèrement preneur. Je dis ça je dis rien.
Français

LLM Knowledge Bases
Something I'm finding very useful recently: using LLMs to build personal knowledge bases for various topics of research interest. In this way, a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating knowledge (stored as markdown and images). The latest LLMs are quite good at it. So:
Data ingest:
I index source documents (articles, papers, repos, datasets, images, etc.) into a raw/ directory, then I use an LLM to incrementally "compile" a wiki, which is just a collection of .md files in a directory structure. The wiki includes summaries of all the data in raw/, backlinks, and then it categorizes data into concepts, writes articles for them, and links them all. To convert web articles into .md files I like to use the Obsidian Web Clipper extension, and then I also use a hotkey to download all the related images to local so that my LLM can easily reference them.
IDE:
I use Obsidian as the IDE "frontend" where I can view the raw data, the the compiled wiki, and the derived visualizations. Important to note that the LLM writes and maintains all of the data of the wiki, I rarely touch it directly. I've played with a few Obsidian plugins to render and view data in other ways (e.g. Marp for slides).
Q&A:
Where things get interesting is that once your wiki is big enough (e.g. mine on some recent research is ~100 articles and ~400K words), you can ask your LLM agent all kinds of complex questions against the wiki, and it will go off, research the answers, etc. I thought I had to reach for fancy RAG, but the LLM has been pretty good about auto-maintaining index files and brief summaries of all the documents and it reads all the important related data fairly easily at this ~small scale.
Output:
Instead of getting answers in text/terminal, I like to have it render markdown files for me, or slide shows (Marp format), or matplotlib images, all of which I then view again in Obsidian. You can imagine many other visual output formats depending on the query. Often, I end up "filing" the outputs back into the wiki to enhance it for further queries. So my own explorations and queries always "add up" in the knowledge base.
Linting:
I've run some LLM "health checks" over the wiki to e.g. find inconsistent data, impute missing data (with web searchers), find interesting connections for new article candidates, etc., to incrementally clean up the wiki and enhance its overall data integrity. The LLMs are quite good at suggesting further questions to ask and look into.
Extra tools:
I find myself developing additional tools to process the data, e.g. I vibe coded a small and naive search engine over the wiki, which I both use directly (in a web ui), but more often I want to hand it off to an LLM via CLI as a tool for larger queries.
Further explorations:
As the repo grows, the natural desire is to also think about synthetic data generation + finetuning to have your LLM "know" the data in its weights instead of just context windows.
TLDR: raw data from a given number of sources is collected, then compiled by an LLM into a .md wiki, then operated on by various CLIs by the LLM to do Q&A and to incrementally enhance the wiki, and all of it viewable in Obsidian. You rarely ever write or edit the wiki manually, it's the domain of the LLM. I think there is room here for an incredible new product instead of a hacky collection of scripts.
English

@RayaneRachid_ Tu parles du code qui aurait soi disant fuité ? J'avoue j'ai pas ouvert le zip 😭😭😭
Français

@ponceto91 Il fait tout ce qu'il veut dessus y a aucun problème. Et il n'arrête pas de s'améliorer. C'est une courbe exponentielle. Votre conseil est déjà littéralement obsolète
Français

Ne. Faites. Pas. Ça. (avec aucun bot, que ce soit Claude, OpenAI, openclaw et cie ... je vous aurai prévenus)
Jonathan Chan 💡📣@ChanPerco
Claude veut vous donner un coup de main en prenant le contrôle de votre Mac. Anthropic ajoute une corde à l’arc de son IA. Le bot Claude ne se contente plus de répondre à des questions : il peut désormais manipuler un ordinateur pour accomplir des tâches
Français

Pouvoir sortir un SaaS en 3 prompts c'est cool, jusqu'à ce que tu captes que tes 8 milliards de concurrents peuvent aussi
Naval@naval
Coding an app is the new starting a podcast.
Français

@LeHibou06 @iamsupersocks Alors là je peux qu'être d'accord avec toi . Faut vraiment faire gaffe justement pour éviter de gaspiller du temps et de l'énergie
Français

@Gissoka @iamsupersocks Non bien sûr; mais c’est un piège à ne pas négliger il me semble
Français

LeWorldModel : quand moins de code produit plus d’intelligence.
Un bébé de 3 mois voit une balle disparaître derrière un écran. Si elle réapparaît de l’autre côté du mur comme si elle l’avait traversé il regarde plus longtemps. Il est surpris. Il sait déjà que c’est impossible.
Les psychologues appellent ça la violation des attentes (Baillargeon, années 80).
L’équipe de LeCun a fait exactement pareil avec une IA de 15 millions de paramètres.
Ils lui montrent une trajectoire normale, puis ils téléportent un objet à un endroit impossible.
Le modèle réagit : son erreur de prédiction explose.
Quand ils changent juste la couleur de l’objet, rien ne se passe.
Comme le bébé, le modèle s’en fiche de l’apparence. C’est le mouvement impossible qui le perturbe (il réagit à la physique).
Ce modèle n’a jamais reconstruit une seule image.
Il ne “voit” pas au sens classique.
Et pourtant il distingue ce qui est physiquement possible de ce qui ne l’est pas.
Ça s’appelle LeWorldModel.
Un world model prédit ce qui se passe physiquement. Un objet tombe, un bras pousse un cube, une balle rebondit.
C’est la couche de base pour tout robot qui planifie, toute voiture autonome qui simule avant de braquer.
L’approche de LeCun : ne pas essayer de prédire les images pixel par pixel. À la place, résumer chaque image en un petit code compact, et prédire le prochain code.
Beaucoup plus léger. Beaucoup plus rapide.
Le problème : tous les modèles précédents trichaient.
Au lieu d’apprendre à comprendre les scènes, ils apprenaient à produire toujours le même code, quelle que soit l’image.
Erreur de prédiction à zéro.
Apprentissage à zéro.
Comme une appli météo bloquée sur “ensoleillé” en permanence.
Pour empêcher ça, les chercheurs empilaient des mécanismes correctifs depuis des années.
Le meilleur modèle avant LeWM combinait 7 règles d’entraînement différentes et 6 réglages à ajuster manuellement.
Résultat : instable, coûteux, et personne ne comprenait vraiment pourquoi ça marchait quand ça marchait.
→ LeWM change l’approche. Au lieu d’empiler des correctifs, il pose une contrainte mathématique unique : les codes produits par le modèle doivent être variés et bien répartis.
Pas le droit de se regrouper sur un seul point.
Si cette contrainte est respectée, la triche est impossible par construction.
La vérification se fait avec un théorème de 1936.
L’idée, vulgarisée : au lieu de vérifier directement que tes codes sont bien répartis dans un espace à 192 dimensions (ce qui est techniquement très dur), tu regardes leur ombre sous plein d’angles différents.
Si chaque ombre a la bonne forme, alors l’objet complet aussi.
Simple, rapide, et mathématiquement prouvé.
Résultat : 2 règles d’entraînement au lieu de 7.
Un seul réglage à trouver au lieu de 6. Et les résultats sont meilleurs.
96% de succès contre 78% pour le modèle précédent sur la tâche de référence.
→ Le résultat le plus contre-intuitif : chaque mécanisme que tu retires améliore les performances.
Tu retires le correctif anti-triche classique.
Mieux. Tu retires la reconstruction d’images.
Mieux. Tu simplifies l’architecture.
Le modèle s’en fiche qu’on utilise tel ou tel type de réseau de neurones.
Quand ta contrainte de base est mathématiquement solide, chaque couche de complexité en plus est du bruit.
→ Le modèle fait 15 millions de paramètres. Il s’entraîne en quelques heures sur un seul GPU. Il planifie 48 fois plus vite que les gros modèles. Le code est ouvert.
AMI Labs, la startup que LeCun vient de fonder, a levé 1 milliard. Le paper sort deux semaines après, en accès libre. Un signal fort.
C’est l’exact opposé de la course au compute. Ce paper ne dit pas qu’il faut plus de puissance. Il dit que quand tu poses la bonne contrainte mathématique, 15 millions de paramètres suffisent.
Moins de code, moins de réglages, moins de compute. Plus de performance.

Français

@LeHibou06 @iamsupersocks Ce genre de raisonnement et de pensée c'est un peu comme un horizon, ça va jamais s'arrêter si on redéfinis à chaque fois les limites de la réalité. Ça coûte rien de tester et de voir , au pire si c'est une impasse. Sauf si t'es un rationaliste anti empirisme 🎈
Français

On parle de “world model”, mais on lui donne notre monde. Notre physique, nos objets, nos découpages. Le modèle n’apprend pas le réel, il apprend une version déjà interprétée du réel.
Même problème que l’Umwelt de von Uexküll : il est enfermé dans un cadre perceptif… qui n’est même pas le sien.
Donc oui, c’est plus propre, plus élégant, plus efficace. Mais ça reste une intelligence qui raffine nos invariants, pas une intelligence qui découvre les siens.
Et il y a un risque plus profond. Un world model est structurellement conservateur : il apprend la régularité et sanctionne la déviation. Tout ce qui sort de son espace latent est synonyme d’ erreur. Pas curiosité: erreur.
Ça risque de devenir un super-zététicien qui confond “je ne peux pas le modéliser” avec “c’est impossible”.
Le langage, lui, permet de poser des hypothèses qui violent nos propres invariants et de les explorer. “Et si la conscience n’était pas produite par le cerveau mais captée par lui ?” Syntaxiquement valide, sémantiquement cohérent, et ça ouvre un espace de pensée. Un world model ne peut pas faire ça: son erreur de prédiction face à l’impossible, c’est un rejet.
Le langage permet de nommer ce qui manque. De dire “il y a quelque chose que ce cadre ne capture pas” sans encore savoir quoi. Aucun world model actuel ne peut accomplir cet acte.
Le vrai saut ne sera pas dans la contrainte mathématique. Il sera dans la capacité à redéfinir ce qui fait “monde” — et aucune architecture enfermée dans un espace latent fixe ne fera ça.
La question ouverte : est-ce que cette capacité est une propriété du langage comme système, ou de la conscience qui utilise le langage ? Si c’est la deuxième option, scaler ne suffira pas.
Français

@BetterCallMedhi Ça me fait penser à une autre phrase un peu dans le même esprit :" Si (pour une tâche donné ) vous saviez exactement qu'il faut 11 échecs avant de réussir.
11 tentatives.
À quelle vitesse vous enchaîneriez les échecs ? "
Français

si vous connaissiez le moment exact de votre mort, si dès votre naissance une horloge était accrochée au mur de votre chambre avec le nombre de jours qu’il vous reste, si vous pouviez voir ce nombre baisser chaque matin en ouvrant les yeux, vous ne vivriez plus jamais pour quelqu’un d’autre que vous
Français

@memoart_dadrien Ce mec c'est un collège , une place , une avenue , un boulevard, c'est la France en poème
Français

@BetterCallMedhi Faut même pas calculer ça va justement filtrer , les gens qui vont les suivre c'est des gens stupides en moins dans tes followers. De la qualité c'est beaucoup mieux que de la quantité
Français

c’est une chose que j’avais déjà anticipé dans un thread l’année dernière
évidemment que la plupart des projets d’IA générative échouent dans les grandes entreprises françaises et je vais vous expliquer pourquoi c’est structurel
le problème MAJEUR reste que les grandes boîtes ne comprennent pas qu'on ne résout pas un problème de structure avec une rustine algorithmique
ces boîtes font exactement la même erreur à chaque fois, elles prennent leur organisation existante avec ses process, ses silos, ses validations à 15 niveaux hiérarchiques et elles essaient de coller une couche d’IA par dessus comme on mettrait un turbo sur une charrette
sauf que ça marche pas parce que l’IA générative exige de repenser les flux de travail depuis 0, le problème c’est que personne dans ces entreprises a le mandat ni le courage de toucher à l’organisation, donc ils font des POC des pilotes, des comités de réflexion, des études de faisabilité…etc etc pendant 18 mois et à la fin ils concluent que l’IA c’est prometteur mais pas encore mature
non c’est votre organisation qui est pas mature et techniquement le problème est encore + profond que ça, ces entreprises essaient d’utiliser des LLMs comme des outils isolés alors que la vraie puissance de l’IA générative vient de l’orchestration
c’est quand vous connectez un modèle à vos bases de données internes via du RAG par ex que vous construisez des pipelines d’agents autonomes capables d’enchaîner des tâches complexes que vous intégrez des function calls pour que l’IA puisse agir directement dans vos systèmes ERP CRM et outils métier
c’est précisément là que la magie opère mais pour faire ça il faut des données propres, des APIs ouvertes et une architecture modulaire (minimum )or les grandes entreprises françaises tournent sur des systèmes legacy empilés depuis 20 ans avec des données en silos que personne a jamais pensé à structurer pour être exploitées par une IA
donc ils finissent par utiliser ChatGPT pour résumer des emails et ils appellent ça une transformation digital et pendant que les grands groupes FR font des Powerpoints sur l’IA, des startups de 5 personnes utilisent Claude pour faire le travail de départements entiers à une fraction du coût
le vrai sujet c’est que l’IA générative fonctionne parfaitement quand vous construisez autour d’elle dès le départ, elle échoue systématiquement quand vous essayez de l’injecter dans une bureaucratie qui a été optimisée pendant 30 ans pour ralentir toute forme de changement
je pense que dans 5 ans on regardera cette période et on réalisera que les grandes entreprises qui ont «échoué » avec l’IA ont en réalité échoué avec elles mêmes
le signal principal que vous devez surtout comprendre à travers mon tweet c’est que sans repenser l'architecture socio-technique, les agents resteront des gadgets à démonstration incapables de s'inscrire durablement dans des chaînes de valeur humaines

Français

@VincentVentalon Elle est psycho rigide par choix , c'est la façon de Google d'assurer la sécurité. Un système stable et rigide , Anthropic ont choisis l'éthique . Mais Openai fait exactement la même chose que Gemini sauf qu'il brosse dans le sens du poil .
l'âge d'or des IA débridée est révolue
Français












