TOKUNAGA Hiroyuki

6.6K posts

TOKUNAGA Hiroyuki banner
TOKUNAGA Hiroyuki

TOKUNAGA Hiroyuki

@tkng

機械学習とカレーが好きなプログラマ。株式会社PredNext代表取締役。

Entrou em Mayıs 2007
1.4K Seguindo2.4K Seguidores
TOKUNAGA Hiroyuki
GLM-5.2ちょっと使ってみてるけど、コード書いてる最中に急にコメント文字列でthinkingしだすのかわいいな
日本語
0
0
0
203
TOKUNAGA Hiroyuki
planとかgrill-meとかやったけど、どんだけ要件を詰めても「えっ、そんなレベルから確認が必要だったんですか?」という誤解が残るので、実装中のdiffなどを確認して方向性を修正するのが一番確実。これをやらないと細かなデザインの瑕疵が増えて、いつのまにかそちらを正にされてしまう。
日本語
0
0
2
183
TOKUNAGA Hiroyuki
Xのおすすめ欄、気を抜くとすぐに謎の海外動画をレコメンドしてくるので、こまめに「興味なし」を教え込んでいる。見たいのはAI関連の論文とかツールのリリース、あとは柴犬の動画とカレーの情報だけです。
日本語
0
0
0
241
TOKUNAGA Hiroyuki
どうしても問題が解決できないので、GPT-5.5 xhighを投入する。持ってくれよ、俺のtoken limit…!! (weekly limit 残り17%)
日本語
0
0
2
388
TOKUNAGA Hiroyuki
うーん、今日のGPT-5.4なんか調子悪い?
日本語
0
0
1
334
TOKUNAGA Hiroyuki
よく考えたら「バケツが立つ」だったとしても十分に意味がわからないな
日本語
0
0
0
260
TOKUNAGA Hiroyuki
@kjim ダイレクトに「なんで桶なの?」って聞いたら「bucketの翻訳です」と答えてくれました、なるほど
日本語
1
1
5
633
TOKUNAGA Hiroyuki
@kjim その手があった。ということで聞いてみたら「桶が立つは、集計に 新しいラベルの記録行が出る という意味です。」って返事が返ってきました。なんでこういう日本語になったのか、詳しく問い詰めても、そこから先はよくわかりませんでしたが……。
日本語
1
0
1
929
TOKUNAGA Hiroyuki
こないだ「Codexって謎の日本語を出してくるよね」という話を @kjim さんとしてたんだけど、今日は「出力が出たら、新しい cpu.runtime と memory の桶が立っているかを確認します」という新しい語録が得られました。「桶が立つ」ってなんなのか、調べてもまったく意味がわからない 😂
日本語
3
1
35
10.1K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Kimi K2.6はよく「hit the model's max output token limit」で止まるのだが、thinkingを見てみると、かなり複雑な文字列でループして、token limitにひっかかっていることが多い。10年前のLSTMの頃に短文を生成し続けるループで止まらなくなる問題があったことを思い出す。
日本語
0
2
4
1.6K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
coding agentで開発速度が上がったと言え、大きな方針転換をすると2週間とかかかるので、それを複数回やってしまうと、このタイミングでこの人に話を持って行きたかったのにまだできてないから無理だ、みたいな感じで予定が大きく狂ってしまう。技術選定の重要性は以前より増しているように感じる。
日本語
0
2
7
1.4K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
genericsを使って静的にコードを生成していて、組み合わせ爆発でコンパイル時間が大変なことになってしまっていたコードのために、jit compilerを新しく実装してそちらで書き換えたらライブラリのビルド時間が1/10くらいになり、満足感のある結果になった。
日本語
0
1
3
439
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
ちょっと複雑なコードを書かせるとGPT-5系には全然敵わないんだけど、1年前はこのレベルでコードを書けるのはClaudeだけだったと思うので、そう思うと進化の早さに目が眩みそうだ。
日本語
0
0
2
301
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Codexの$100プランで実装までしてもらうと3日くらいでweekly limitを踏むので他にいろいろ使ってみたところ、Devinで使えるKimi K2.6が異様にコスパがよくて、簡単なことはそれなりにこなせることに気づいた。SWE-1.6にはもう戻れない、くらいに大きな差がある。
日本語
1
1
4
643
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Kimi K2.6、思ったより賢くて驚いたんだけど、gitを使わせると絶対やっちゃダメなこといっぱいやってくるな……。git resetとgit commitは禁止しとかないとダメだけど、sandbox中でbypass permissionsで動かしてるので、そういう際に特定のコマンドだけ禁止するって、どうやればいいんだろう?
日本語
0
0
1
273
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
www-cdn.anthropic.com/d00db56fa754a1… のP.13に"new interventions that limit Claude’s effectiveness for requests targeting frontier LLM development (for example, on building pretraining pipelines, distributed training infrastructure, or ML accelerator design)." という記載がある。
日本語
0
0
0
460
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
えっ、Claude Fableは"frontier LLM development"のコードを書かせると、黙って非協力的になるの? しかも、例示されてる範囲だけでもML accelerator designみたいにfrontier LLM developmentに関わりが薄いものも入ってるし。だんだんディストピア感が出てきたな。
日本語
2
2
21
4.1K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Claude 4.6, 4.7でDNN推論エンジンの開発してたらやけにポンコツだったのも、もしかして黙ってサボってたのか?
日本語
0
0
2
397
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
5月末でCodexの2x token limitが終わってからというもの、かなり厳しい。$100プランだと、2並列で作業してるとあっという間になくなる。GPT-5.5 highからGPT-5.4 mediumに変えたけど、それでもすぐになくなる。しかし、$200プランに行くのは厳しいなぁ。
日本語
0
0
3
635
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
墓石に一つだけデータ構造の名前を彫るとしたらなにを選ぶ?
日本語
0
0
0
296