TOKUNAGA Hiroyuki

6.6K posts

TOKUNAGA Hiroyuki

@tkng

機械学習とカレーが好きなプログラマ。株式会社PredNext代表取締役。

Entrou em Mayıs 2007

1.4K Seguindo2.4K Seguidores

TOKUNAGA Hiroyuki@tkng·5h

GLM-5.2ちょっと使ってみてるけど、コード書いてる最中に急にコメント文字列でthinkingしだすのかわいいな

日本語

203

TOKUNAGA Hiroyuki@tkng·14h

planとかgrill-meとかやったけど、どんだけ要件を詰めても「えっ、そんなレベルから確認が必要だったんですか？」という誤解が残るので、実装中のdiffなどを確認して方向性を修正するのが一番確実。これをやらないと細かなデザインの瑕疵が増えて、いつのまにかそちらを正にされてしまう。

日本語

183

TOKUNAGA Hiroyuki@tkng·3d

Xのおすすめ欄、気を抜くとすぐに謎の海外動画をレコメンドしてくるので、こまめに「興味なし」を教え込んでいる。見たいのはAI関連の論文とかツールのリリース、あとは柴犬の動画とカレーの情報だけです。

日本語

241

TOKUNAGA Hiroyuki@tkng·4d

どうしても問題が解決できないので、GPT-5.5 xhighを投入する。持ってくれよ、俺のtoken limit…！！（weekly limit 残り17%）

日本語

388

TOKUNAGA Hiroyuki@tkng·5d

うーん、今日のGPT-5.4なんか調子悪い？

日本語

334

TOKUNAGA Hiroyuki@tkng·5d

よく考えたら「バケツが立つ」だったとしても十分に意味がわからないな

日本語

260

TOKUNAGA Hiroyuki@tkng·5d

@kjim ダイレクトに「なんで桶なの？」って聞いたら「bucketの翻訳です」と答えてくれました、なるほど

日本語

633

TOKUNAGA Hiroyuki@tkng·5d

@kjim その手があった。ということで聞いてみたら「桶が立つは、集計に新しいラベルの記録行が出るという意味です。」って返事が返ってきました。なんでこういう日本語になったのか、詳しく問い詰めても、そこから先はよくわかりませんでしたが……。

日本語

929

TOKUNAGA Hiroyuki@tkng·5d

こないだ「Codexって謎の日本語を出してくるよね」という話を @kjim さんとしてたんだけど、今日は「出力が出たら、新しい cpu.runtime と memory の桶が立っているかを確認します」という新しい語録が得られました。「桶が立つ」ってなんなのか、調べてもまったく意味がわからない 😂

日本語

10.1K

TOKUNAGA Hiroyuki@tkng·17 Haz

Kimi K2.6はよく「hit the model's max output token limit」で止まるのだが、thinkingを見てみると、かなり複雑な文字列でループして、token limitにひっかかっていることが多い。10年前のLSTMの頃に短文を生成し続けるループで止まらなくなる問題があったことを思い出す。

日本語

1.6K

TOKUNAGA Hiroyuki@tkng·17 Haz

coding agentで開発速度が上がったと言え、大きな方針転換をすると2週間とかかかるので、それを複数回やってしまうと、このタイミングでこの人に話を持って行きたかったのにまだできてないから無理だ、みたいな感じで予定が大きく狂ってしまう。技術選定の重要性は以前より増しているように感じる。

日本語

1.4K

TOKUNAGA Hiroyuki@tkng·17 Haz

genericsを使って静的にコードを生成していて、組み合わせ爆発でコンパイル時間が大変なことになってしまっていたコードのために、jit compilerを新しく実装してそちらで書き換えたらライブラリのビルド時間が1/10くらいになり、満足感のある結果になった。

日本語

439

TOKUNAGA Hiroyuki@tkng·13 Haz

ちょっと複雑なコードを書かせるとGPT-5系には全然敵わないんだけど、1年前はこのレベルでコードを書けるのはClaudeだけだったと思うので、そう思うと進化の早さに目が眩みそうだ。

日本語

301

TOKUNAGA Hiroyuki@tkng·13 Haz

Codexの$100プランで実装までしてもらうと3日くらいでweekly limitを踏むので他にいろいろ使ってみたところ、Devinで使えるKimi K2.6が異様にコスパがよくて、簡単なことはそれなりにこなせることに気づいた。SWE-1.6にはもう戻れない、くらいに大きな差がある。

日本語

643

TOKUNAGA Hiroyuki@tkng·11 Haz

Kimi K2.6、思ったより賢くて驚いたんだけど、gitを使わせると絶対やっちゃダメなこといっぱいやってくるな……。git resetとgit commitは禁止しとかないとダメだけど、sandbox中でbypass permissionsで動かしてるので、そういう際に特定のコマンドだけ禁止するって、どうやればいいんだろう？

日本語

273

TOKUNAGA Hiroyuki@tkng·10 Haz

www-cdn.anthropic.com/d00db56fa754a1… のP.13に"new interventions that limit Claude’s effectiveness for requests targeting frontier LLM development (for example, on building pretraining pipelines, distributed training infrastructure, or ML accelerator design)." という記載がある。

日本語

460

TOKUNAGA Hiroyuki@tkng·10 Haz

えっ、Claude Fableは"frontier LLM development"のコードを書かせると、黙って非協力的になるの？しかも、例示されてる範囲だけでもML accelerator designみたいにfrontier LLM developmentに関わりが薄いものも入ってるし。だんだんディストピア感が出てきたな。

日本語

4.1K

TOKUNAGA Hiroyuki@tkng·10 Haz

Claude 4.6, 4.7でDNN推論エンジンの開発してたらやけにポンコツだったのも、もしかして黙ってサボってたのか？

日本語

397

TOKUNAGA Hiroyuki@tkng·8 Haz

5月末でCodexの2x token limitが終わってからというもの、かなり厳しい。$100プランだと、2並列で作業してるとあっという間になくなる。GPT-5.5 highからGPT-5.4 mediumに変えたけど、それでもすぐになくなる。しかし、$200プランに行くのは厳しいなぁ。

日本語

635

TOKUNAGA Hiroyuki@tkng·6 Haz

墓石に一つだけデータ構造の名前を彫るとしたらなにを選ぶ？