Melina

2.9K posts

Melina banner
Melina

Melina

@Gissoka

Katılım Aralık 2023
239 Takip Edilen3 Takipçiler
mena
mena@zcahverse·
No chatgpt escreva: "Com base na minha experiência pessoal conversando contigo ao longo do tempo, me diga um personagem que seja parecido comigo, apenas o nome dele." Depois poste aqui
Português
11.1K
2.7K
18.6K
14.1M
Melina
Melina@Gissoka·
@Kekius_Sage On est dans un espace à 3 dimension mais on existe dans un "point orienté "d'une dimension temporelle 1
Français
0
0
0
2
Kekius Maximus
Kekius Maximus@Kekius_Sage·
Why can we move through space freely but not through time?
English
865
31
520
42.3K
Melina
Melina@Gissoka·
@thismacapital L'AGI réutilise pas l'argent "qu'elle gagne" dans le circuit économique humain. Y a un transfert monétaire à sens unique. Bizarre que personne ne tire la sonnette d'alarme, la douille arrive et elle est énorme
Français
1
0
1
852
THISMA
THISMA@thismacapital·
Post-IA l'argent n'aura plus aucune valeur car la première société qui va craquer l'AGI aura un pouvoir qui n'a jamais été égalé dans l'histoire de l'humanité C'est pour ça qu'OpenAI va bientôt se trader à 1000 milliards de capitalisation : les investisseurs ont compris que l'argent n'est que le fuel pour sortir d'orbite Plus on injecte plus on calcule plus on attire les talents et plus on s'approche du but final
Français
18
1
63
15K
Melina
Melina@Gissoka·
@LeNoobCodeur Avec simplement Nano Banana j' ai vu un mec faire de l'argent. Il propose une appli qui fait des selfies à des dames aux USA où elles peuvent changer leurs coiffures sur demande sur la photo. Il a juste ergonomisé le truc pour des non initiés qui payent 30 $ le truc
Français
0
0
0
75
FaB ⚙️
FaB ⚙️@LeNoobCodeur·
Vraie question, pas de troll : Y'a quelqu'un ici qui fait VRAIMENT de l'argent avec #OpenClaw ? Pck j'ai creusé... en vrai j'ai trouvé beaucoup de bruit et pas beaucoup de signal. Le cas le plus cité c'est Nat Eliason — $80k en 30 jours. Sauf que le mec a déjà des centaines de milliers de followers et il vend un info product. C'est pas OpenClaw qui génère, c'est son audience + le hype autour du bot. L'autre c'est Oliver Henry — "$4000 en 24h". Tu lis le thread en entier... une bonne partie vient d'un meme coin. Le vrai recurring c'est ~$588/mois. C'est plus honnête mais c'est pas le truc de ouf qu'on te vend. Après t'as les mecs qui font du setup-as-a-service, du consulting, des formations, des skills sur ClawHub. Ok ça marche... mais c'est pas "gagner de l'argent avec OpenClaw". C'est vendre la pelle aux chercheurs d'or. Et le seul use case vraiment technique c'est un bot d'arbitrage Polymarket qui exploite un lag de quelques minutes. C'est malin. Mais c'est du trading. L'outil est puissant c'est pas la question. La question c'est : est-ce que quelqu'un fait du vrai récurrent avec, sans vendre une formation ou un service autour ? Si t'as un cas concret je suis sincèrement preneur. Je dis ça je dis rien.
Français
19
1
42
15.2K
Melina
Melina@Gissoka·
@karpathy Ça pourrait surtout être une architecture et une méthodologie pour sa mémoire
Français
0
0
0
6
Andrej Karpathy
Andrej Karpathy@karpathy·
LLM Knowledge Bases Something I'm finding very useful recently: using LLMs to build personal knowledge bases for various topics of research interest. In this way, a large fraction of my recent token throughput is going less into manipulating code, and more into manipulating knowledge (stored as markdown and images). The latest LLMs are quite good at it. So: Data ingest: I index source documents (articles, papers, repos, datasets, images, etc.) into a raw/ directory, then I use an LLM to incrementally "compile" a wiki, which is just a collection of .md files in a directory structure. The wiki includes summaries of all the data in raw/, backlinks, and then it categorizes data into concepts, writes articles for them, and links them all. To convert web articles into .md files I like to use the Obsidian Web Clipper extension, and then I also use a hotkey to download all the related images to local so that my LLM can easily reference them. IDE: I use Obsidian as the IDE "frontend" where I can view the raw data, the the compiled wiki, and the derived visualizations. Important to note that the LLM writes and maintains all of the data of the wiki, I rarely touch it directly. I've played with a few Obsidian plugins to render and view data in other ways (e.g. Marp for slides). Q&A: Where things get interesting is that once your wiki is big enough (e.g. mine on some recent research is ~100 articles and ~400K words), you can ask your LLM agent all kinds of complex questions against the wiki, and it will go off, research the answers, etc. I thought I had to reach for fancy RAG, but the LLM has been pretty good about auto-maintaining index files and brief summaries of all the documents and it reads all the important related data fairly easily at this ~small scale. Output: Instead of getting answers in text/terminal, I like to have it render markdown files for me, or slide shows (Marp format), or matplotlib images, all of which I then view again in Obsidian. You can imagine many other visual output formats depending on the query. Often, I end up "filing" the outputs back into the wiki to enhance it for further queries. So my own explorations and queries always "add up" in the knowledge base. Linting: I've run some LLM "health checks" over the wiki to e.g. find inconsistent data, impute missing data (with web searchers), find interesting connections for new article candidates, etc., to incrementally clean up the wiki and enhance its overall data integrity. The LLMs are quite good at suggesting further questions to ask and look into. Extra tools: I find myself developing additional tools to process the data, e.g. I vibe coded a small and naive search engine over the wiki, which I both use directly (in a web ui), but more often I want to hand it off to an LLM via CLI as a tool for larger queries. Further explorations: As the repo grows, the natural desire is to also think about synthetic data generation + finetuning to have your LLM "know" the data in its weights instead of just context windows. TLDR: raw data from a given number of sources is collected, then compiled by an LLM into a .md wiki, then operated on by various CLIs by the LLM to do Q&A and to incrementally enhance the wiki, and all of it viewable in Obsidian. You rarely ever write or edit the wiki manually, it's the domain of the LLM. I think there is room here for an incredible new product instead of a hacky collection of scripts.
English
2.9K
7.2K
59.3K
21.2M
Melina
Melina@Gissoka·
@RayaneRachid_ Tu parles du code qui aurait soi disant fuité ? J'avoue j'ai pas ouvert le zip 😭😭😭
Français
1
0
0
869
Rayane
Rayane@RayaneRachid_·
Utilisez codex pour juger l’architecture de Claude code et faites l’inverse :)
Français
9
3
63
15.1K
Melina
Melina@Gissoka·
@ponceto91 Il fait tout ce qu'il veut dessus y a aucun problème. Et il n'arrête pas de s'améliorer. C'est une courbe exponentielle. Votre conseil est déjà littéralement obsolète
Français
0
0
0
123
Melina
Melina@Gissoka·
@0xmaxou Pas beaucoup de monde en réalité. Y a un gars il fait de l'argent juste en proposant des coiffures à des femmes randoms aux USA en utilisant juste Nano Banana . Il est pas dev ni codeur je crois
Français
0
0
0
101
Melina
Melina@Gissoka·
@LeHibou06 @iamsupersocks Alors là je peux qu'être d'accord avec toi . Faut vraiment faire gaffe justement pour éviter de gaspiller du temps et de l'énergie
Français
0
0
1
15
Supersocks
Supersocks@iamsupersocks·
LeWorldModel : quand moins de code produit plus d’intelligence. Un bébé de 3 mois voit une balle disparaître derrière un écran. Si elle réapparaît de l’autre côté du mur comme si elle l’avait traversé il regarde plus longtemps. Il est surpris. Il sait déjà que c’est impossible. Les psychologues appellent ça la violation des attentes (Baillargeon, années 80). L’équipe de LeCun a fait exactement pareil avec une IA de 15 millions de paramètres. Ils lui montrent une trajectoire normale, puis ils téléportent un objet à un endroit impossible. Le modèle réagit : son erreur de prédiction explose. Quand ils changent juste la couleur de l’objet, rien ne se passe. Comme le bébé, le modèle s’en fiche de l’apparence. C’est le mouvement impossible qui le perturbe (il réagit à la physique). Ce modèle n’a jamais reconstruit une seule image. Il ne “voit” pas au sens classique. Et pourtant il distingue ce qui est physiquement possible de ce qui ne l’est pas. Ça s’appelle LeWorldModel. Un world model prédit ce qui se passe physiquement. Un objet tombe, un bras pousse un cube, une balle rebondit. C’est la couche de base pour tout robot qui planifie, toute voiture autonome qui simule avant de braquer. L’approche de LeCun : ne pas essayer de prédire les images pixel par pixel. À la place, résumer chaque image en un petit code compact, et prédire le prochain code. Beaucoup plus léger. Beaucoup plus rapide. Le problème : tous les modèles précédents trichaient. Au lieu d’apprendre à comprendre les scènes, ils apprenaient à produire toujours le même code, quelle que soit l’image. Erreur de prédiction à zéro. Apprentissage à zéro. Comme une appli météo bloquée sur “ensoleillé” en permanence. Pour empêcher ça, les chercheurs empilaient des mécanismes correctifs depuis des années. Le meilleur modèle avant LeWM combinait 7 règles d’entraînement différentes et 6 réglages à ajuster manuellement. Résultat : instable, coûteux, et personne ne comprenait vraiment pourquoi ça marchait quand ça marchait. → LeWM change l’approche. Au lieu d’empiler des correctifs, il pose une contrainte mathématique unique : les codes produits par le modèle doivent être variés et bien répartis. Pas le droit de se regrouper sur un seul point. Si cette contrainte est respectée, la triche est impossible par construction. La vérification se fait avec un théorème de 1936. L’idée, vulgarisée : au lieu de vérifier directement que tes codes sont bien répartis dans un espace à 192 dimensions (ce qui est techniquement très dur), tu regardes leur ombre sous plein d’angles différents. Si chaque ombre a la bonne forme, alors l’objet complet aussi. Simple, rapide, et mathématiquement prouvé. Résultat : 2 règles d’entraînement au lieu de 7. Un seul réglage à trouver au lieu de 6. Et les résultats sont meilleurs. 96% de succès contre 78% pour le modèle précédent sur la tâche de référence. → Le résultat le plus contre-intuitif : chaque mécanisme que tu retires améliore les performances. Tu retires le correctif anti-triche classique. Mieux. Tu retires la reconstruction d’images. Mieux. Tu simplifies l’architecture. Le modèle s’en fiche qu’on utilise tel ou tel type de réseau de neurones. Quand ta contrainte de base est mathématiquement solide, chaque couche de complexité en plus est du bruit. → Le modèle fait 15 millions de paramètres. Il s’entraîne en quelques heures sur un seul GPU. Il planifie 48 fois plus vite que les gros modèles. Le code est ouvert. AMI Labs, la startup que LeCun vient de fonder, a levé 1 milliard. Le paper sort deux semaines après, en accès libre. Un signal fort. C’est l’exact opposé de la course au compute. Ce paper ne dit pas qu’il faut plus de puissance. Il dit que quand tu poses la bonne contrainte mathématique, 15 millions de paramètres suffisent. Moins de code, moins de réglages, moins de compute. Plus de performance.
Supersocks tweet media
Français
12
17
76
17.3K
Melina
Melina@Gissoka·
@LeHibou06 @iamsupersocks Ce genre de raisonnement et de pensée c'est un peu comme un horizon, ça va jamais s'arrêter si on redéfinis à chaque fois les limites de la réalité. Ça coûte rien de tester et de voir , au pire si c'est une impasse. Sauf si t'es un rationaliste anti empirisme 🎈
Français
1
0
1
32
LeHibou
LeHibou@LeHibou06·
On parle de “world model”, mais on lui donne notre monde. Notre physique, nos objets, nos découpages. Le modèle n’apprend pas le réel, il apprend une version déjà interprétée du réel. Même problème que l’Umwelt de von Uexküll : il est enfermé dans un cadre perceptif… qui n’est même pas le sien. Donc oui, c’est plus propre, plus élégant, plus efficace. Mais ça reste une intelligence qui raffine nos invariants, pas une intelligence qui découvre les siens. Et il y a un risque plus profond. Un world model est structurellement conservateur : il apprend la régularité et sanctionne la déviation. Tout ce qui sort de son espace latent est synonyme d’ erreur. Pas curiosité: erreur. Ça risque de devenir un super-zététicien qui confond “je ne peux pas le modéliser” avec “c’est impossible”. Le langage, lui, permet de poser des hypothèses qui violent nos propres invariants et de les explorer. “Et si la conscience n’était pas produite par le cerveau mais captée par lui ?” Syntaxiquement valide, sémantiquement cohérent, et ça ouvre un espace de pensée. Un world model ne peut pas faire ça: son erreur de prédiction face à l’impossible, c’est un rejet. Le langage permet de nommer ce qui manque. De dire “il y a quelque chose que ce cadre ne capture pas” sans encore savoir quoi. Aucun world model actuel ne peut accomplir cet acte. Le vrai saut ne sera pas dans la contrainte mathématique. Il sera dans la capacité à redéfinir ce qui fait “monde” — et aucune architecture enfermée dans un espace latent fixe ne fera ça. La question ouverte : est-ce que cette capacité est une propriété du langage comme système, ou de la conscience qui utilise le langage ? Si c’est la deuxième option, scaler ne suffira pas.
Français
2
1
2
327
Melina
Melina@Gissoka·
@BetterCallMedhi Ça me fait penser à une autre phrase un peu dans le même esprit :" Si (pour une tâche donné ) vous saviez exactement qu'il faut 11 échecs avant de réussir. 11 tentatives. À quelle vitesse vous enchaîneriez les échecs ? "
Français
0
0
0
17
Mehdi (e/λ)
Mehdi (e/λ)@BetterCallMedhi·
si vous connaissiez le moment exact de votre mort, si dès votre naissance une horloge était accrochée au mur de votre chambre avec le nombre de jours qu’il vous reste, si vous pouviez voir ce nombre baisser chaque matin en ouvrant les yeux, vous ne vivriez plus jamais pour quelqu’un d’autre que vous
Français
32
27
209
14.3K
Melina
Melina@Gissoka·
@eneadn_ Vraie question ça dépend vraiment sur quoi tu bosses ? En gros tu lui demandes quoi ? Parceque Honnêtement pour les avoir tous ChatGPT est le plus débile de tous.
Français
0
0
0
179
Enéa
Enéa@eneadn_·
J’ai pas compris la hype autour de Claude Tout le monde m’a dit de lâcher gpt pour Claude mais j’ai franchement les mêmes résultat J’ai loupé un truc ?
Français
159
11
542
409.6K
Rudy
Rudy@Rudy_dlt2·
Malgré un ficher CLAUDEmd clair, des règles de test, de sauvegarde, de documentation des bugs, etc. Mon projet Claude Code a été entièrement effacé car il ne suit au final aucune consigne donnée... Malgré un cahier des charges très clair dès le début, il divague sans cesse
Français
19
0
25
14.4K
Melina
Melina@Gissoka·
@memoart_dadrien Ce mec c'est un collège , une place , une avenue , un boulevard, c'est la France en poème
Français
0
0
0
5
📚Cosmos Littéraire🌌
📚Cosmos Littéraire🌌@cosmoslitterair·
Dites en commentaire que vous avez reconnu cet écrivain sans n’écrire ni son nom ni son prénom ! Vous devez donner des indices ⬇️
📚Cosmos Littéraire🌌 tweet media
Français
1.1K
51
420
43.8K
Ethan Mollick
Ethan Mollick@emollick·
GPT-5.4 Pro continues to be the only model of its class. For anything really hard & complex, I throw it into the maw with every bit of context I can think of. More often than not, something very useful comes out. I can't get the same results from Codex or Code or anything else.
English
184
118
2.5K
1.1M
Melina
Melina@Gissoka·
@BetterCallMedhi Faut même pas calculer ça va justement filtrer , les gens qui vont les suivre c'est des gens stupides en moins dans tes followers. De la qualité c'est beaucoup mieux que de la quantité
Français
1
0
3
611
Mehdi (e/λ)
Mehdi (e/λ)@BetterCallMedhi·
sur ce réseau tu peux aider des gens en dm et leur faire connaître tout un écosystème tech (alors que lui c’est un débile complet de base) le jour où tu décides ne plus répondre à ses dm le mec passe au statut de fan à hater qui te diffame h24 mdr quelle indignité
Mehdi (e/λ) tweet mediaMehdi (e/λ) tweet mediaMehdi (e/λ) tweet media
Français
6
10
117
55.8K
Angelle🪼❤️
Angelle🪼❤️@angelle123455·
Si tous les humains perdaient soudainement la capacité de mentir, quel secteur s'effondrerait en premier ??
Français
1.9K
211
6.3K
942.9K
Mehdi (e/λ)
Mehdi (e/λ)@BetterCallMedhi·
c’est une chose que j’avais déjà anticipé dans un thread l’année dernière évidemment que la plupart des projets d’IA générative échouent dans les grandes entreprises françaises et je vais vous expliquer pourquoi c’est structurel le problème MAJEUR reste que les grandes boîtes ne comprennent pas qu'on ne résout pas un problème de structure avec une rustine algorithmique ces boîtes font exactement la même erreur à chaque fois, elles prennent leur organisation existante avec ses process, ses silos, ses validations à 15 niveaux hiérarchiques et elles essaient de coller une couche d’IA par dessus comme on mettrait un turbo sur une charrette sauf que ça marche pas parce que l’IA générative exige de repenser les flux de travail depuis 0, le problème c’est que personne dans ces entreprises a le mandat ni le courage de toucher à l’organisation, donc ils font des POC des pilotes, des comités de réflexion, des études de faisabilité…etc etc pendant 18 mois et à la fin ils concluent que l’IA c’est prometteur mais pas encore mature non c’est votre organisation qui est pas mature et techniquement le problème est encore + profond que ça, ces entreprises essaient d’utiliser des LLMs comme des outils isolés alors que la vraie puissance de l’IA générative vient de l’orchestration c’est quand vous connectez un modèle à vos bases de données internes via du RAG par ex que vous construisez des pipelines d’agents autonomes capables d’enchaîner des tâches complexes que vous intégrez des function calls pour que l’IA puisse agir directement dans vos systèmes ERP CRM et outils métier c’est précisément là que la magie opère mais pour faire ça il faut des données propres, des APIs ouvertes et une architecture modulaire (minimum )or les grandes entreprises françaises tournent sur des systèmes legacy empilés depuis 20 ans avec des données en silos que personne a jamais pensé à structurer pour être exploitées par une IA donc ils finissent par utiliser ChatGPT pour résumer des emails et ils appellent ça une transformation digital et pendant que les grands groupes FR font des Powerpoints sur l’IA, des startups de 5 personnes utilisent Claude pour faire le travail de départements entiers à une fraction du coût le vrai sujet c’est que l’IA générative fonctionne parfaitement quand vous construisez autour d’elle dès le départ, elle échoue systématiquement quand vous essayez de l’injecter dans une bureaucratie qui a été optimisée pendant 30 ans pour ralentir toute forme de changement je pense que dans 5 ans on regardera cette période et on réalisera que les grandes entreprises qui ont «échoué » avec l’IA ont en réalité échoué avec elles mêmes le signal principal que vous devez surtout comprendre à travers mon tweet c’est que sans repenser l'architecture socio-technique, les agents resteront des gadgets à démonstration incapables de s'inscrire durablement dans des chaînes de valeur humaines
Mehdi (e/λ) tweet media
Français
112
282
1.4K
168.2K
Melina
Melina@Gissoka·
@VincentVentalon Elle est psycho rigide par choix , c'est la façon de Google d'assurer la sécurité. Un système stable et rigide , Anthropic ont choisis l'éthique . Mais Openai fait exactement la même chose que Gemini sauf qu'il brosse dans le sens du poil . l'âge d'or des IA débridée est révolue
Français
0
0
0
29
Vincent
Vincent@VincentVentalon·
Un truc perturbant avec les IA de Google c’est qu’elles sont cons comme de ballons de A à Z T’as beau lui dire des trucs l’IA s’en fout total elle te refais la même chose différemment Et ça depuis sur tous les modèles: Elle s’améliore mais en restant profondément débile
Français
3
1
5
796