TOKUNAGA Hiroyuki

6.6K posts

TOKUNAGA Hiroyuki banner
TOKUNAGA Hiroyuki

TOKUNAGA Hiroyuki

@tkng

機械学習とカレーが好きなプログラマ。株式会社PredNext代表取締役。

Katılım Mayıs 2007
1.4K Takip Edilen2.4K Takipçiler
TOKUNAGA Hiroyuki
codexのgoal機能、作業を完了するまで1時間とかコードを書いたりデバッグしたりし続けてくれるのでありがたい。「作業は完了ですか?」「ではそちらの未完了事項を実施してください」みたいな定型文を打つ回数がだいぶ減った。賢かった頃のclaude codeのplan機能を使ってるみたいな感覚。
日本語
0
0
1
202
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane お互い無関係の第三者同士ですが、 @methane さんの書いていることがあまりにも不可思議に見えたので、ついリプライしてしまいました。ご意見に同意はしませんが、お考えはある程度理解できたと思います。お付き合いいただき、ありがとうございました。
日本語
0
0
0
288
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane 「見えます」というのは、commit logが改竄されている可能性もあるかもしれないので、断言はできない、という留保です。
日本語
1
0
0
311
methane
methane@methane·
結局、mattnさんが自認メンテナだったのにarpさんはそう思ってなくて、過去の経緯でコミット権を得た人が暴走しはじめたと思ってコミット権持ってる全員を排除したってことか? 原作者をorgから排除したのが誤情報だと言ってるけど、orgにarpさんしか残ってないのはどういうことだろ?
日本語
1
3
6
7.2K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane 「人は悪意なく簡単に誤認に基づく発言をする」ので、「I would ask, then, that this not be read as the same story as "made a few commits, then added himself as a sponsor."」は誤認に基づくものであって、"who lies all the time"は「非常に悪い」ということでしょうか?
日本語
1
0
0
644
methane
methane@methane·
@tkng そうは思いませんね。 というか、私にも誤認があり、 "who lies all the time" と言ったのはarpさんではなくumlx5hさんでした。その後のコメントでarpさんはその発言を嗜めています。 このように人は悪意なく簡単に誤認に基づく発言をするものです。
日本語
1
2
3
958
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane この言葉を「非常に悪い」と批判して、#757 の「I would ask, then, that this not be read as the same story as "made a few commits, then added himself as a sponsor."」の論拠が嘘であることを批判しないのは偏り過ぎではないですか、というのがお伝えしたかったことです。
日本語
0
0
0
123
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane #757 で「I would ask, then, that this not be read as the same story as "made a few commits, then added himself as a sponsor."」と書いてしまっている(ご本人はFUNDING.yml編集前に4 commitしかないことはわかっているはず)からにはwho lies all the timeという言葉は妥当な範囲では?
日本語
2
0
0
782
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@methane 元発言の前には「Why do you lie so effortlessly? Let’s check the merge dates for the 11 PRs and the timestamp of the sponsor adding commit.」とあり、実際、commit logを見ると11 PRs merge datesより前にFUNDING.ymlが変更されています。この点について嘘つきと書かれるのは仕方ないのでは?
日本語
1
0
1
920
methane
methane@methane·
mattnさんの方にも問題はあっただろうけれど、arpさんが説明なしにkickしたのが発端なのに、「レビューアがいないことよりも嘘つき野郎(who lies all the time)がメンテナにいるほうが怖い」とまで言ってしまうのは非常に悪い。 #issuecomment-4404143556" target="_blank" rel="nofollow noopener">github.com/fsnotify/fsnot…
日本語
2
1
6
4.2K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
@a_bicky なるほど。うつ伏せ寝自体を防ぐのは無理ですね、毎回ひっくり返してたら親がノイローゼになってしまいそう 😥
日本語
0
0
1
67
Takeshi Arabiki
Takeshi Arabiki@a_bicky·
@tkng ですです、SIDSが心配で…。うちもベビーアラーム導入してるんですが、わざわざ拘ってうつ伏せ寝の検知に対応してるものを購入したのに、寝返りが始まってから頻繁に鳴るようになって、うつ伏せ寝アラートは切っちゃいました😂(去年の12月に生まれました!ありがとうございます!)
日本語
1
0
0
314
Takeshi Arabiki
Takeshi Arabiki@a_bicky·
赤ちゃんを仰向けで寝かせるのは基本だけど、寝返りを覚えたら仰向けを維持するのは無理ゲーじゃないか…?
日本語
1
0
0
637
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
MI350P、気になるな…。お値段どれくらいなんだろ。
日本語
0
0
1
397
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
やけどしたところにキズパワーパッド貼ったらすんごくかゆくなった。そもそもII度以上のやけどには使うべきでないらしい。
日本語
0
0
0
429
まっくす
まっくす@minux302·
なんと、本日結婚いたしました!
まっくす tweet media
日本語
51
27
910
30.2K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
arcee.ai/trinity と名前かぶってるけどいいのかな…
Sakana AI@SakanaAILabs

What if instead of building one giant AI, we evolved a coordinator to orchestrate a diverse team of specialized AIs? 🐟 Excited to share our new paper: “TRINITY: An Evolved LLM Coordinator”, published as a conference paper at #ICLR2026! Paper: arxiv.org/abs/2512.04695 In nature, complex problems are rarely solved by a single monolithic entity, but rather by the coordinated efforts of specialized individuals working together. Yet, modern AI development is heavily focused on endlessly scaling up single, massive monolithic models, yielding diminishing returns. While model merging offers a way to combine different skills, it is often impractical due to mismatched neural architectures and the closed-source nature of top-performing models. To address this, we took a macro-level approach: test-time model composition. We introduce TRINITY, a system that fuses the complementary strengths of diverse, state-of-the-art models without needing to modify their underlying weights. TRINITY processes queries over multiple turns. At each step, a lightweight coordinator assigns one of three distinct roles to an LLM from its available pool: 1/ Thinker: Devises high-level strategies and analyzes the current state. 2/ Worker: Executes concrete problem-solving steps. 3/ Verifier: Evaluates if the current solution is complete and correct. By dynamically assigning these roles, the coordinator effectively offloads complex reasoning and skill execution onto the external models. What makes TRINITY unique is its extreme efficiency. The coordinator relies on the hidden states of a compact language model and a small routing head. In total, it has fewer than 20K learnable parameters. Training this system presented a massive challenge. Traditional Reinforcement Learning (REINFORCE) failed because the gradients had a low signal-to-noise ratio due to binary rewards and weak parameter coupling. Imitation learning (Supervised Fine-Tuning) was ruled out because generating multi-turn labels is prohibitively expensive. Our solution? We turned to nature-inspired algorithms. We optimized the coordinator using a derivative-free evolutionary algorithm. We found that evolution is uniquely suited to optimize this tight, high-dimensional coordination problem where traditional gradient-based methods fail. The results are very promising. In our experiments, TRINITY consistently outperforms existing multi-agent methods and individual models across various benchmarks. At the time of publication, it set a new state-of-the-art record on LiveCodeBench, achieving an 86.2% pass@1 score. More importantly, it demonstrated incredible generalization. Without any retraining, TRINITY transferred zero-shot to four unseen tasks (AIME, BigCodeBench, MT-Bench, and GPQA). On average, the evolved coordinator surpassed every individual constituent model in its pool, including GPT-5, Gemini 2.5-Pro, and Claude-4-Sonnet (the top frontier models available at the time of our #ICLR2026 submission last year). This work is central to Sakana AI's vision. We believe the future of AI isn't just about scaling monolithic models, but engineering collaborative, diverse AI ecosystems that can adapt and combine their strengths. We invite the community to read the paper and explore these ideas! Paper: arxiv.org/abs/2512.04695 OpenReview: openreview.net/forum?id=5HaRj… This foundational research is part of the core engine powering our multi-agent product: Sakana Fugu 🐡👇

日本語
0
0
1
734
TOKUNAGA Hiroyuki retweetledi
matsuu
matsuu@matsuu·
Ollamaやめましょうと。 / “Friends Don't Let Friends Use Ollama | Sleeping Robots” htn.to/jzt7NHtQcf
日本語
0
7
19
2.9K
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
新しいFramework Laptop 13 Pro、滅茶評判が良さそうなので欲しいけど、(当たり前だけど)キーボードに日本語配列がないんだよな
日本語
0
0
0
355
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Opus 4.7、賢くなってるかなと期待して使ってみたけど、1日試した感じでは4.6と大差なかった。全然指示に従ってくれないワ〜〜〜。
日本語
0
0
1
341
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Paged Attention、概念は簡単だけど、PyTorchのJIT compileと組み合わせて動くように実装しろと言われると、実装方法は全然自明じゃないな
日本語
0
0
0
323
TOKUNAGA Hiroyuki
TOKUNAGA Hiroyuki@tkng·
Opus 4.7、なんかGPTっぽい喋り方するようになってない?
日本語
0
0
0
256