William Arin

86 posts

William Arin banner
William Arin

William Arin

@william_arin

AI Ops / SWE / DevOps / SRE.

Sumali Eylül 2022
556 Sinusundan25 Mga Tagasunod
Tanishq Mathew Abraham, Ph.D.
Honestly, is there any reason why you would use ChatGPT over Codex??? I pretty much don't visit ChatGPT anymore...
English
93
1
181
47.4K
William Arin
William Arin@william_arin·
@doregex @BlockedPaths Yes, but I'm not sure if they will catch up that quickly. Last december it felt like Chinese models lagged 4-5 months behind. But GPT 5.0 in september already understood intent very well, and 9 months later Chinese models are still not at this level I think.
English
2
0
1
18
Alberto 思辰
Alberto 思辰@doregex·
@william_arin @BlockedPaths I mean, do you remember when models ask about the quality of the response or what you would change? that's the part that chinese models miss.
English
1
0
0
10
BlockedPath
BlockedPath@BlockedPaths·
Kimi K2.7 did not impress me in the slightest. No where near 5.5 or deepseek.
English
27
0
54
14.2K
William Arin
William Arin@william_arin·
@doregex @BlockedPaths I would argue that capability is not there if you need to be specific. The whole point of intelligence is understanding unclear intent, this is what makes US models so above Chinese models.
English
1
0
0
9
Alberto 思辰
Alberto 思辰@doregex·
I have to say that on a migration task i tried with gpt5.5 on xhigh, it made a mess, i tried with kimi2.7 code using opencode go plan, it performed better I think the main issue people have is using the right prompt for the chinese models, you need to be more specific on what you want, there is less "magic", but capability are there. I don't know, but I guess that the benchmark prompts are somewhat more detailed than the average user
English
1
0
0
286
William Arin
William Arin@william_arin·
@c0dedaddy @amritwt Before Deepseek there's Google and OpenAI who will be pleased to take all their customers. Why would any company drive prices up when competitors are waiting to crush them...
English
0
0
0
13
{...eddie}
{...eddie}@c0dedaddy·
@amritwt That’s a guaranteed way to push most of who’s paying the bills over there to Deepseek and then they get nothing. OS is creeping up on enterprise models and very soon itll catch up fully. They’re stuck
English
1
0
1
468
amrit
amrit@amritwt·
if you think that a $200 claude code subscription is alot wait until they remove the subsidisation and now you have to pay $5000 a month instead
English
121
14
1K
62.8K
William Arin
William Arin@william_arin·
@leploutos Le truc a 22 points sur Artificial Analysis. Minimax M2.7 qui est inutilisable tellement il est con, a 50 points.
Français
0
0
1
109
Le PLOUTOS
Le PLOUTOS@leploutos·
Depuis 24h, je teste Mistral Vibe sur du vrai dev : gros repo, tâches longues, terminal, CLI et tout le bordel. C’est pas le feu d’artifice dès la première seconde comme avec Claude ou GPT. Vibe joue pas ce jeu-là. Il construit un truc plus profond : terminal + cloud + agents distants + PR propres + tâches qui tournent sans que tu sois collé devant. Le vrai sujet en 2026 c’est plus “est-ce qu’il code bien une fonction”. Ca, tout le monde sait à peu près le faire. C’est plutôt : est-ce qu’il bosse dans MON environnement réel ? Est-ce qu’il comprend le repo sans tout casser ? Est-ce que je peux lui filer une tâche longue et revenir deux heures après ? Est-ce que je garde vraiment la main ? Sur ces points, @mistralvibe tape très juste et très pro. Et puis y’a le côté Mistral : infra européenne, énergie bas carbone, souveraineté. Dit comme ça ça sent un peu le cocorico, mais pour une fois c’est pas con. Quand tu donnes ton repo, tes secrets et ta logique métier, la question “où ça tourne ?” devient concrète. Mon ressenti à chaud : - CLI hyper agréable - tâches cadrées qui passent nickel - les agents distants sentent le game changer - l’ensemble fait “outil pro” plutôt qu’effet waouh C’est moins tape-à-l’œil. Mais ça sent la vraie brique d’infrastructure pour bosser avec des agents dans un flow quotidien. Pour une première version, ça fait plaisir. Après des années à être à la bourre, on a enfin un produit concret européen sur ce terrain. Si tu veux un agent qui s’intègre vraiment dans ton quotidien, teste Vibe. Ça vaut le coup.
Le PLOUTOS tweet media
Français
13
10
139
13K
The Noble Simian
The Noble Simian@thenoblesimian·
@ThePrimeagen My boss is a trained SWE and over the last year transitioned to not coding by hand. I barely code by hand anymore unless it's making a small change that I don't want to waste tokens on. So essentially I only use coding by hand for cost savings.
English
1
0
3
1.3K
William Arin
William Arin@william_arin·
@GamerBike39 @RayaneRachid_ Tu raisonnes encore comme un dev de 2024. On ne travaille plus "sur des fichiers" mais sur des produits. Tu n'as pas besoin de savoir quelles lignes précises, quelles fonctions font quoi. C'est plus ton job mais celui de l'IA. T'es pas à un prompt près.
Français
2
0
2
49
GamerBike
GamerBike@GamerBike39·
@william_arin @RayaneRachid_ Comment tu fais quand tu veux travailler sur des fichiers, voir des lignes précises, ou une fonction si tu sais pas où elle est ? V'là la depense de token si l'IA doit explorer la codebase à chaque fois
Français
1
0
0
42
simobis
simobis@simobis23·
@cheatyyyy Flash 1.5: $0.075 | $0.30 Flash 2 : $0.10 | $0.4 Flash 2.5: $0.30 | $2.50 Flash 3 $0.50 | $3 Flash 3.5 $1.5 | $9 Flash 4 $5 | $30 ????
English
2
0
43
5.1K
Tibo
Tibo@thsottiaux·
For those of you living inside the codex app, what should we prioritize among features, reliability or performance?
English
1.9K
36
2.1K
282.9K
William Arin
William Arin@william_arin·
@JonDotJames @nightkingog @DavidOndrej1 Sorry! The workflow you proposed is not ideal, it's easier to setup ssh tunnels (or cloudflare tunnels) to work on the dev directly without git in the middle, that way you have 95% of the "on my machine" experience
English
0
0
0
23
David Ondrej
David Ondrej@DavidOndrej1·
stop developing locally start developing on a VPS trust me
English
343
114
3.4K
803.9K
William Arin
William Arin@william_arin·
@nightkingog @DavidOndrej1 You can develop on an old laptop, on a phone while you're outside, on your other gaming computer, on your mac, on your wife's laptop, without reinstalling everything each time. You just have one source of truth for everything. This is life changing.
English
4
0
1
883
Hemz
Hemz@i_m_hemz·
@DavidOndrej1 What do i get from it, apart from paying some extra dollars?
English
4
0
5
12.3K
William Arin
William Arin@william_arin·
@thsottiaux Windows Terminal + WSL2 + SSH + tmux + remote codex cli. The era of personal computers is over. We just need terminals. Please add remote connections to the app.
English
0
0
2
393
Tibo
Tibo@thsottiaux·
As a Codex user, which platform are you on
English
506
21
704
221.2K
William Arin
William Arin@william_arin·
@ledevnovice La branche part sur le staging. Master build l'image de prod. Le tag part sur la prod.
Français
0
0
2
879
Le Dev Novice
Le Dev Novice@ledevnovice·
Qui fait des branches de feature sur ses projets perso les ami(e)s codeurs ?
Français
66
0
77
28.2K
Shobhit Shrivastava
Shobhit Shrivastava@shri_shobhit·
@championswimmer Off-topic, but any idea why the traffic from Singapore is so high? I checked with AI, and it told me "probably" because of data centres and VPNs. I am not convinced though
English
10
0
5
11.1K
Arnav Gupta
Arnav Gupta@championswimmer·
> 300 millions users turns out to be 300 M "visits" > turns out this is cumulative 300M visits in 12 months 😅 > "replaced all SaaS with my AI coded ones" - maybe if you uses some SaaS like Posthog/Mixpanel you'd have the ability to count DAU/MAU for real
Arnav Gupta tweet media
English
71
9
927
113.5K
William Arin
William Arin@william_arin·
@Anthyra_dev @jeremie_m_dev La review se fait par les IAs, pas par toi. Quand tu gères une équipe de 30 devs, tu fais pas la review de code de tes juniors/confirmés/seniors. Tu ne fais pas de review de code assembleur généré par un compilateur, donc pas de raison de faire de la review de ton php/ts/java...
Français
0
0
0
39
Anthyra
Anthyra@Anthyra_dev·
@jeremie_m_dev Mais donc avec tout ça tu as jamais le temps de review le code qu’il fait non ? J’avoue que c’est un flow que j’imagine à peine
Français
3
0
1
2.2K
Anthyra
Anthyra@Anthyra_dev·
Les devs, je vois de plus en plus de vidéo avec des personnes qui ont X terminaux avec claude / codex ect. C’est du giga bullshit ou certains on de vrais cas d’usages ? J’en ai 2, un pour les taches et un pour tout ce qui est plus général. Un troisième pour des test ou autre si besoin. Et vous ?
Français
37
0
37
20.2K
Tibo
Tibo@thsottiaux·
Send us feature requests for codex in the form of an images 2.0 generated image. It makes it easier for codex to implement if we decide to go for it. Saw some good ones today already that codex is cooking on.
English
619
50
2.3K
179.6K
William Arin
William Arin@william_arin·
@llmdevguy @Angaisb_ A big day of work (10 hours) on one project uses 50% of weekly usage on Plus plan. So I guess he parallelizes several projects at this same rate of work.
English
0
0
0
13
Mateusz Mirkowski
Mateusz Mirkowski@llmdevguy·
@Angaisb_ I don't how do you do that. I am on plus plan and used 5% of weekly limit with 2 hours works yesterday.
English
1
0
4
245