dataStrategies

4.8K posts

dataStrategies banner
dataStrategies

dataStrategies

@_DataStrategies

Frédéric Lefebvre Data+IA @Niji_digital (recrute), 📖 "Les data", 👨‍🏫 ParisCité. La tech c'est des contenants, les data des contenus. J'❤️les contenus !

Katılım Temmuz 2013
483 Takip Edilen303 Takipçiler
Sabitlenmiş Tweet
dataStrategies
dataStrategies@_DataStrategies·
Ce jeudi 12 mars, j'assistais à un exposé de deux étudiants (@foaster) sur deux expériences qui ont fait le buzz, dont un positionnement politique des IA. Ça m'a donné envie d'interroger ChatGPT sur les municipales d'Argenteuil. democratesansfrontiere.org/?post/2026/03/…
dataStrategies tweet media
Français
1
0
0
198
Alexander Doria
Alexander Doria@Dorialexander·
Breaking: @pleiasfr and @nvidia release the first open synthetic dataset for personas in Europe: Nemotron-Personas-France. 1M synthetic French persons, with rich imaginary lives grounded on (complex) demographic distribution.
Alexander Doria tweet media
English
33
90
714
76.9K
dataStrategies retweetledi
Yulu Gan
Yulu Gan@yule_gan·
Simply adding Gaussian noise to LLMs (one step—no iterations, no learning rate, no gradients) and ensembling them can achieve performance comparable to or even better than standard GRPO/PPO on math reasoning, coding, writing, and chemistry tasks. We call this algorithm RandOpt. To verify that this is not limited to specific models, we tested it on Qwen, Llama, OLMo3, and VLMs. What's behind this? We find that in the Gaussian search neighborhood around pretrained LLMs, diverse task experts are densely distributed — a regime we term Neural Thickets. Paper: arxiv.org/pdf/2603.12228 Code: github.com/sunrainyg/Rand… Website: thickets.mit.edu
Yulu Gan tweet media
English
86
431
3K
666.5K
dataStrategies
dataStrategies@_DataStrategies·
(oui, beaucoup de gens ont une alerte de sécurité sur mon blog. Désolé) Notez que ChatGPT fait, à ce stade de la conversation, une découverte qui l'incite à répondre à côté de la démarche qu'il annonçait !
Français
0
0
0
16
dataStrategies
dataStrategies@_DataStrategies·
Ce jeudi 12 mars, j'assistais à un exposé de deux étudiants (@foaster) sur deux expériences qui ont fait le buzz, dont un positionnement politique des IA. Ça m'a donné envie d'interroger ChatGPT sur les municipales d'Argenteuil. democratesansfrontiere.org/?post/2026/03/…
dataStrategies tweet media
Français
1
0
0
198
dataStrategies
dataStrategies@_DataStrategies·
@francoisfleuret (I'm thinking of forward algorithms such as k-means or raking ratio, which in practice optimize a criterion, but without backward passes and with very few iterations. An equivalent in deep learning would be cool.)
English
0
0
0
10
dataStrategies
dataStrategies@_DataStrategies·
@francoisfleuret « sure, but so far it works, even better than critics anticipated » My own interrogation is at the very basic level of backprop: do biological brains optimize this way? is there a more clever, and computationally lighter, way to learn?
English
1
0
3
245
François Fleuret
François Fleuret@francoisfleuret·
I can't help thinking that the AI community moved the bulk of the resource and efforts on getting as much as possible from the GPT architecture through scaling, prompting, and agent-swarming, even though the said architecture is missing key elements. 1/2
English
27
10
278
86K
dataStrategies
dataStrategies@_DataStrategies·
La publication de contenu IA sans relecture frappe même @helloasso … "Ce site, gouv fr, est une source d’information primordiale. (…). Ce domaine est régi par le ministère de la Culture, souvent mentionné comme gouv." helloasso.com/blog/la-licenc…
Français
0
0
0
24
dataStrategies
dataStrategies@_DataStrategies·
@c2m @ZakShark Ce qui fait de vos textes des points éloignés de la moyenne de la distribution des textes humains.
Français
1
0
0
62
Zak 🦈 (e/acc)
Zak 🦈 (e/acc)@ZakShark·
Toute université et tout prof ayant recours à ce genre de détecteur IA est un abruti fini car ne comprend pas comment fonctionne la détection statistique et sabote le travail des étudiants. Les fameux "détecteurs de texte IA" reposent sur l'idée que le texte généré par IA aurait des propriétés statistiques distinctes du texte humain. Or les LLMs sont entraînés précisément sur du texte humain. Le problème est principalement un problème de classification binaire sur deux distributions qui se chevauchent. En gros un détecteur essaie de séparer deux distributions : P_humain et P_IA, or les LLMs sont entraînés pour minimiser la divergence KL (Kullback-Leibler) entre leur distribution et celle du texte humain i.e. D_KL(P_humain | P_IA) ---> 0
Zak 🦈 (e/acc) tweet media
Կատերինա@Kate__yan

Ça commence à m’énerver. On est obligé d’écrire comme des débiles pour pas qu’on pense que ça a été rédigé par une IA ????

Français
19
121
838
96.1K
dataStrategies retweetledi
dataStrategies
dataStrategies@_DataStrategies·
@_cluxter_ @Shirleyyych Attention. Les 30 compétences techniques en question, Claude Code peut les avoir déjà, ou bientôt. Seules, elles vaudront bientôt aussi peu que, disons, la compétence pour marcher sans savoir où l'on va.
Français
1
0
1
412
dataStrategies retweetledi
Caitlin Kalinowski
Caitlin Kalinowski@kalinowski007·
I resigned from OpenAI. I care deeply about the Robotics team and the work we built together. This wasn’t an easy call. AI has an important role in national security. But surveillance of Americans without judicial oversight and lethal autonomy without human authorization are lines that deserved more deliberation than they got. This was about principle, not people. I have deep respect for Sam and the team, and I’m proud of what we built together.
English
1.9K
13.1K
59.3K
7.6M
dataStrategies retweetledi
Ilya Sutskever
Ilya Sutskever@ilyasut·
It’s extremely good that Anthropic has not backed down, and it’s siginficant that OpenAI has taken a similar stance. In the future, there will be much more challenging situations of this nature, and it will be critical for the relevant leaders to rise up to the occasion, for fierce competitors to put their differences aside. Good to see that happen today.
English
1.4K
2.5K
25.6K
3M
dataStrategies retweetledi
Bo Wang
Bo Wang@BoWang87·
Prof. Donald Knuth opened his new paper with "Shock! Shock!" Claude Opus 4.6 had just solved an open problem he'd been working on for weeks — a graph decomposition conjecture from The Art of Computer Programming. He named the paper "Claude's Cycles." 31 explorations. ~1 hour. Knuth read the output, wrote the formal proof, and closed with: "It seems I'll have to revise my opinions about generative AI one of these days." The man who wrote the bible of computer science just said that. In a paper named after an AI. Paper: cs.stanford.edu/~knuth/papers/…
Bo Wang tweet media
English
155
1.9K
9.1K
1.2M
dataStrategies
dataStrategies@_DataStrategies·
ça se défend.
Defend Intelligence (Anis Ayari)@DFintelligence

En ce moment, je parle avec certains COMEX qui réfléchissent à leur feuille de route IA. Et je fais un constat catastrophique, qui n’est que la résultante de ce qu’on observe depuis 4 ans sur le marché de l’IA. Des pseudo-experts autoproclamés ont fait vaciller les orientations de certaines entreprises en promettant un ROI direct. ➡️Au début , avec des formations au prompt qui se sont au final avérées totalement inutiles. ➡️Puis il y a eu la mode de faire ses propres ChatGPT internes, qui se cognent à des dizaines de milliers d’euros de maintenance pour une utilisation quasi nulle en interne. ➡️Ensuite, on a promis une automatisation à grande échelle en oubliant les socles de base que sont le besoin métier et la donnée. ➡️Et maintenant, certains vendeurs de perlimpinpin prétendent mettre des agents partout. Je sens qu’on est en train de redescendre la courbe de la hype et que, d’ici quelques mois, il va y avoir des constats durs lors de certaines clôtures budgétaires, quand il n’y aura pas le ROI en face des investissements. Je recommande à toutes les entreprises de s’entourer de sachants en machine learning qui étaient là avant la hype de l’IA 2021. Des data scientists qui ont connu la montée du deep learning ont toutes les cartes en main pour aider à la construction d’une IA agentique et plus en entreprise. Fuyez les experts n8n, les experts du prompt, et les experts IA qui se prétendent spécialistes parce qu’ils pensent pouvoir vous dire ce qui est “le mieux” entre ChatGPT et Claude. Il y a 10 ans, on n’avait pas la chance d’avoir des experts en IA tant le domaine était nouveau. Aujourd’hui, on a la chance d’avoir des personnes formées qui savent ce qu’est l’IA, comment architecturer une solution avec la donnée au centre, et comment évaluer (ou ne pas évaluer) la pertinence de l’IA dans un contexte donné. Vous en pensez quoi ?

Français
0
0
0
45
dataStrategies
dataStrategies@_DataStrategies·
Ça, c'est un big bang pour les métiers du conseil. (Dit un directeur data/IA qui a passé des jours de février à changer des détails dans un PPT de façon cohérente d'une page à l'autre).
Marc-André Moreau@awakecoding

Claude in PowerPoint (claude.com/claude-in-powe…) is absolutely worth it. So far, my experience with AI and PowerPoint had been very frustrating and basic, but this is the real deal! I am impressed 👇

Français
0
0
2
97