Ma_Ch

681 posts

Ma_Ch banner
Ma_Ch

Ma_Ch

@Nitram_Writer

Beigetreten Haziran 2012
307 Folgt73 Follower
Ma_Ch
Ma_Ch@Nitram_Writer·
@Fabien_Mikol @HieroDeiis C'est moi où il se contredit ? Comment ça peut être le choix statistique de la réponse la plus probable et que la réponse change tout le temps pour la même question ? Justement, si c'était purement statistique on aurait bien moins de variance non ? 👀
Français
1
0
0
23
Fabien
Fabien@Fabien_Mikol·
@HieroDeiis explique pourquoi les LLM ne sont pas intelligents. Les ingénieurs et ceux qui s'y connaissent ne serait-ce qu'un peu : regardez, c'est tout simplement lunaire. Chaque slide est incroyable. Il ne comprend manifestement rien à ce qu'il raconte, c'est complètement fou.
Français
10
1
18
1.4K
Ma_Ch
Ma_Ch@Nitram_Writer·
Minimax 2.7 is not multimodal? I spent my time pasting screenshot in @opencode with kimi k2.5, @SkylerMiao7 will Minimax models have vision in the future?
English
4
0
50
3.9K
Ma_Ch
Ma_Ch@Nitram_Writer·
@itsjustmarky @opencode @SkylerMiao7 Maybe I'll give it a shot after I finish evaluating M2.7 workflow with multiple subagents regarding large features (spoiler: works quite great at 90% efficacy)
English
1
0
2
12
sudo rm -rf
sudo rm -rf@itsjustmarky·
@Nitram_Writer @opencode @SkylerMiao7 You can run Qwen 3.5 27B it has vision and is very strong as it is dense, even competing with MiniMax M2.5 (provided you are not doing extreme coding).
English
1
0
0
21
Ma_Ch
Ma_Ch@Nitram_Writer·
@itsjustmarky @opencode @SkylerMiao7 Indeed but I'm using vision probably >150 times a day, because I make multiple rounds on frontend and UX, so vision is mandatory in my workflow. Hence, I prefer only one model I know the behaviour of, so I can call a skill or subagents instead of jumping between two specialists.
English
2
0
1
27
sudo rm -rf
sudo rm -rf@itsjustmarky·
@Nitram_Writer @opencode @SkylerMiao7 Agreed, but I'd rather not dumb down my primary model. You using a separate agent also keeps your context from filling up. And you can point to a cloud provider to run Qwen 9b or 27B for pennies. Unless you are doing thousands of images a day, it works great.
English
1
0
0
17
Ma_Ch
Ma_Ch@Nitram_Writer·
@itsjustmarky @opencode @SkylerMiao7 Yeah but it's an extra workaround and an extra model to work with. Since they have all their pro/cons, I avoid this kind of setup.
English
1
0
0
64
Ma_Ch
Ma_Ch@Nitram_Writer·
@DFintelligence Oui, d'où l'importance de croiser les sources. Mais Composer 2 serait une version RL de Kimi K2.5 donc le benchmark paraît cohérent.
Français
0
0
0
93
Ma_Ch
Ma_Ch@Nitram_Writer·
@cortisquared Je pense qu'il ne faut pas oublier que les modèles chinois sont aussi en réponse au blocus américain. La Chine cherche à avoir une place sur le plan international et cette position politique est poussée par le Parti et les grosses entreprises BATX
Français
0
0
1
108
Corti (Cortiste)
Corti (Cortiste)@cortisquared·
La réalité c’est qu'on est *en ce moment* en train d'assister à une forte commodification des modèles. N'importe quel boite avec de la data et des thunes pour le compute peut sortir un modèle pertinent. Xiaomi vient de sortir un modèle à 1T paramètres apparemment très pertinent
Français
8
1
23
3.7K
Ma_Ch
Ma_Ch@Nitram_Writer·
@Fabien_Mikol ça me rappelle ce post viral d'il y a qq jours d'une ingénieure IA alignement qui a laissé OpenClaw trier ses mails et OC a commencé à tout supprimer, sans pouvoir le stopper malgré des messages clairs. La réalisation de la tâche semble être instoppable🫥
Français
0
0
2
19
Fabien
Fabien@Fabien_Mikol·
@Nitram_Writer Non, on ne comprend pas bien pourquoi ils ignorent à ce point cet aspect du system prompt
Fabien tweet media
Français
1
0
1
21
Fabien
Fabien@Fabien_Mikol·
"Les modèles ne résistent au shutdown que dans des scénarios complètement fictifs, artificiels et irréalistes" La réalité : cette résistance existe vraiment même pour des tâches banales, et même si le prompt system précise explicitement qu'il ne faut pas résister au shutdown...
Fabien tweet mediaFabien tweet mediaFabien tweet media
Jeffrey Ladish@JeffLadish

@perrymetzger @robbensinger @playborhood @patrissimo We observed shutdown resistance on some of the very first prompts we tried: openreview.net/forum?id=e4bTT…

Français
4
1
9
1.4K
Ma_Ch
Ma_Ch@Nitram_Writer·
@cortisquared J'étais très impatient de tester Devstral 2 avec Mistral vibe cli mais tous mes tests ont été bien en deça de mes attentes malheureusement
Français
0
0
2
580
Corti (Cortiste)
Corti (Cortiste)@cortisquared·
Ça fait 1000 ans que je n’ai pas entendu parler d’une innovation technologique de mistral.
Français
23
2
53
14K
Ma_Ch
Ma_Ch@Nitram_Writer·
@gchampeau @Zai_org Glm. 4.7 sur Cursor était mon daily driver pendant longtemps. Glm 5 a fait énormément monté les prix, qualité présenté mais token output beaucoup beaucoup trop lent.
Français
0
0
0
34
Ma_Ch
Ma_Ch@Nitram_Writer·
@scaling01 You mean it's Poe favorite model?
Ma_Ch tweet media
English
0
0
0
358
Lisan al Gaib
Lisan al Gaib@scaling01·
it seems like GPT-5.4 is the Garlic model
English
24
1
456
56.2K
Ma_Ch
Ma_Ch@Nitram_Writer·
@Fabien_Mikol Il y a encore son copyright en "2021" en bas à gauche, je vais casser quelque chose...
Français
0
0
1
18
Fabien
Fabien@Fabien_Mikol·
Grâce aux photos des fans, on sait qu'il a pu reproduire sa merveille "démonstration mathématique" prouvant définitivement que l'intelligence humaine est inatteignable. Quelle chance pour le public ! x.com/Fabien_Mikol/s…
Fabien tweet media
Fabien@Fabien_Mikol

Je ne laisserai jamais personne se moquer des démonstrations mathématiques de Luc Julia 😡 Contemplez cette merveilleuse "démonstration par l'absurde géométrique", et sans tableau en plus ! Les acclamations tant de l'animateur que du public de @DevoxxFR devraient vous calmer 😠

Français
7
1
16
1.7K
Fabien
Fabien@Fabien_Mikol·
Succès de la conférence hier à Troyes de Luc Julia, "l"un des grands spécialistes mondieux de l'intelligence artificielle". Le message est bien passé : on "bouscule les idées reçues", et on sait désormais que "les machines ne sont pas près de remplacer l'intelligence humaine" 🤗
Fabien tweet mediaFabien tweet mediaFabien tweet mediaFabien tweet media
Fabien@Fabien_Mikol

@TechnopoleAube explique pourquoi ils ont décidé d'inviter Luc Julia pour une nième conférence à Troyes : "démystifier" l'IA, et faire comprendre que l'IA "n'est pas la menace à laquelle on s'attend". On voit l'intérêt premier : rassurer le grand public et les acteurs économiques

Français
7
1
22
2.9K
Ma_Ch retweetet
dax
dax@thdxr·
sent this to the team today everything great comes from being able to delay gratification for as long as possible and it feels like we're collectively losing our ability to do that
dax tweet media
English
254
707
6.9K
962.3K
Ma_Ch
Ma_Ch@Nitram_Writer·
@teortaxesTex It's probably out for testing before extra finetuning, I'll wait for the official release, and juicy study academic papers.
English
1
0
0
235
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞)
If Hunter Alpha is DeepSeek-V4-1T, then DeepSeek-Web must be like 3T. It's significantly sharper. It's also sharper tan it was a month ago. It allocates reasoning better: less rumination where not needed, actually tries on hard tasks. And – better data taste. Hunter is… okay.
Teortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞) tweet mediaTeortaxes▶️ (DeepSeek 推特🐋铁粉 2023 – ∞) tweet media
English
17
1
121
12K