hiromi maeo

24

hiromi maeo@enhanced_jp·1h

@kgsi そう。だからもうデザイナーとは言えないかもw 何やってるかわからない人になってます。

日本語

1

10

こぎそ@kgsi·2h

@enhanced_jp わかる、AI触るのが楽しくってそっちばかりに目が行きがち問題

日本語

0

1

29

こぎそ@kgsi·3h

デザイナーにスコープ絞って、Claude MaxプランかChat GPT Proプランを契約してないと入れない勉強会イベントとかやったらどれぐらいきてくれるんだろ。濃ゆいイベントにはなると思うが母数がどの程度いるか気になる🤔 コレ読んで🖐️ってひと、リプ欲しい。

日本語

2

1

24

2.9K

hiromi maeo@enhanced_jp·1h

元論文 arxiv.org/pdf/2604.14228

日本語

How To Prompt@HowToPrompt__

19

hiromi maeo@enhanced_jp·1h

Claude Codeの98%はAIじゃない。この投稿に関して、面白そうだったのでarXivの元論文（arXiv:2604.14228）まで当たってみた。論文自体は実在するし、わりと真面目な工学比較研究。核が単純なwhileループで、コードの大半は周辺システム — 権限モードにML分類器、多段のコンテキスト圧縮、worktree隔離のサブエージェント。ここは本当。引っかかったのは投稿の結論のほう。「みんなが良いモデルを競ってる中、Anthropicだけが正反対にインフラの要塞を築いた」という部分。これ、要塞を築くのはAnthropicの逆張りじゃなくて、エージェント道具を作る全員の通り道であって、OpenAIのCodex CLIもGoogleのGemini CLIも、モデルも作りつつ決定論ソフトを分厚く被せてる。両方オープンソースだから開けば分かる。まったく同じ構造ってわけじゃないけど、同じ設計課題（権限・サンドボックス・サブエージェント・チェックポイント）に似た部品で答えてるはず。比べるなら道具は道具と — Claude Codeの隣に置くのはCodex CLIやGeminiCLIで、地続きの差はあっても「Anthropicだけが反対を向いた」事実はないんじゃないかな。 === もうひとつ、1.6%がAIって数字。これはコード量の話であって、価値の所在じゃない。数字だけで見るとインパクトあるけどね。正確には、AIの判断に関わるコードが推定1.6%ってことで、モデル呼び出しの行を数えた値じゃない。残りの98.4%は、その頭脳を暴走させずに使い切るための器 — 権限の番人、膨らむ文脈の圧縮、サブエージェントの隔離などなどに使われてる。だから、コードの割合が小さい=貢献が小さいわけじゃない。モデルが賢さの上限を決めて、周りの工学がその賢さをどれだけ落とさず引き出せるかを決める。だから賢いモデルを取りこぼさず引き出すためには工学が要る。これは自分でループを組んでて毎日実感してる部分。賢いモデルを置いただけじゃ、ブレーキがないから止まるべき所で止まらないし、文脈もすぐ溢れる。ハーネスを分厚くするのは、モデルの性能を諦めたからじゃなくて、その賢さを一滴も取りこぼさないためでもある。まあ、このあたりは次のフロンティアモデルでも生きてくるはず。Fable使ったときも思ったけど。しかし、Opus 4.8はたまにそれを超えるやらかしをするときもあるのはやや残念ではある。

Researchers show that Claude Code is 98% not AI. Anthropic never gave us the architecture for Claude Code. There were no docs. Just a tool that every developer is currently obsessing over. Until it leaked recently. A research team pulled the source code, analyzed all 500,000 lines, and found something ridiculous. Only 1.6% of the codebase actually interacts with the AI model. The core of Claude Code is literally just a simple while-loop. It asks the model what to do, runs a tool, and repeats. So what is the other 98.4%? It is hardcore, traditional software engineering. The researchers found a massive, complex infrastructure designed entirely to babysit the AI and keep it from hallucinating or destroying your computer: - A 7-mode permission system acting as a security bouncer. - A 5-layer context compaction pipeline so the AI doesn't forget its goal. - A subagent delegation mechanism with strict worktree isolation. - Four different extensibility hooks to manage external tools safely. Every startup right now is trying to build a better AI model to get better results. Anthropic did the exact opposite. They took an existing model and built a fortress of deterministic software around it. They realized that the AI doesn't need to be smarter. It needs to be managed.

日本語

0

174

hiromi maeo@enhanced_jp·2h

@kgsi ちょっとデザイナーの皆さんから色々吸収したいっす。ずっとClaudeCodeの仕組みの部分ばかり触ってたので、正直アウトプットの部分がおざなりになってるので。

日本語

0

1

39

こぎそ@kgsi·2h

@enhanced_jp まえおさんは間違いなく来てくれるって信じてる🤗

日本語

0

1

139

hiromi maeo@enhanced_jp·2h

@kgsi そうなんですよね。ブランドとして信頼感損なう行為だなぁと。とりあえずcodexの方がOpus4.8よりも信頼性が高いので載せ替え変えれる分は変更作業してます。

日本語

0

1

62

こぎそ@kgsi·3h

@enhanced_jp もう一回使おうってなりにくいですわよね。

日本語

0

1

59

hiromi maeo@enhanced_jp·3h

うちにもclaude -p/Agent SDK従量クレジット枠の件の延期メールが来てた。昨日追加でより詳細に調べたら、まだまだclaude -pを使ってた部分があったので、早めに対策しておこう。しかし、こんなことで振り回されてリソース割かれるのは面倒すぎる。

今日からclaude -p/Agent SDKが従量クレジット枠に変わるみたい。とはいえ作業の主軸は無料据え置きの対話モードで、headless利用も軽い設計なので影響はほぼゼロ。重い無人headlessを常用してなかったので今のところ安心。「お金使わない実装しろ」とClaudeCodeに宣言しておいてよかった🌝 support.claude.com/ja/articles/15…

日本語

Higgsfield AI 🧩@higgsfield

0

1

332

hiromi maeo@enhanced_jp·3h

HiggsfieldのPhotoshopプラグインはなかなか良さそう。ちょっと試してみる。

Higgsfield Plugin for Photoshop is live. 1. Real Time turns your sketch into a finished image as you draw, in any style. 2. Decompose any image into editable layers. 3. Restyle any photo with a preset or prompt. Your whole creative pipeline, inside Photoshop.

日本語

1

89

hiromi maeo@enhanced_jp·3h

@suna_gaku Geminiはまあ、うん…

日本語

0

1

47

スナガク@suna_gaku·8h

Gemini は、きっとこれから進化する… 知らんけど…

Tyler@rezoundous

feeling opus 4.8 or gpt 5.5 isn't good? go use gemini for 5 minutes.

日本語

만원만 l manwonman@quietcomp_

6

736

hiromi maeo@enhanced_jp·4h

表現生成においては平均化しないよう、Anti-banal（凡庸化回避）の仕組みを使ってる。 AIが出してくる第一連想は凡庸の最たるものとも言える。これはFableとも話した帰結。特にブランド構築においては、凡庸＝失敗みたいなとこあるので、この仕組みは結構前から組み込んでる。とは言え結局のところ、生成されたものが凡庸かどうかを判断するのは人間でしかないので、あくまでも気休めなんだけど。

[디자인의 미래는 이 리포트를 보면 끝난다] 디자이너라면 한 번쯤 들어봤을 iF Design에서 디자인 트렌드 리포트가 나오고 있었다는 거 알고 계셨나요 올해 리포트에서 가장 흥미로운 부분은 AI 자체보다, AI가 만들어내는 '평균화'와 '차별화'의 충돌을 다룬다는 점입니다. 누구나 비슷한 툴을 쓰고 비슷한 결과물을 만들 수 있는 시대가 되면서, 오히려 독창성과 개성이 더 중요한 경쟁력이 되고 있다는 것이죠. 이 외에도 1. 편리함을 추구하는 문화 vs 직접 배우고 만드는 문화 2. 자연과 기술이 결합하는 새로운 생태계 3. 도시를 커뮤니티 중심으로 재해석하는 움직임 등 디자인을 넘어 사회 전반의 변화를 함께 다루고 있습니다. 흥미로운 건 이제 디자인 트렌드가 색상이나 스타일이 아니라, 사람들이 앞으로 어떻게 살고, 만들고, 연결될 것인가를 다루기 시작했다는 점! ifdesign.com/en/trend-report

日本語

1

2

179

hiromi maeo@enhanced_jp·4h

@super_bonochin ですです。昨日はスキルに入れてる私の口調で回答し始めたり笑お前、これまでそんなことなかったやんか…と。

日本語

1

29

炎鎮🔥 - ₿onochin -@super_bonochin·4h

マジで何かがおかしいですよね最近 x.com/i/status/20667…

これは確かにそう。なので、フェーズ/タスク分解して、キリのいいところでのコンパクションを徹底してる。コードに関してもcodex:rescueでレビューするようにしてる。しかし最近、生成された文章が「？お前何言ってんの？」となることも多く、結果手戻りが多いのが気になるところ。

日本語

炎鎮🔥 - ₿onochin -@super_bonochin

0

6

1.7K

炎鎮🔥 - ₿onochin -@super_bonochin·4h

Opus 最近どうしちゃったの？ってマジで思いますわ。同じような意見をすごく多く見かける。いきなりエグいミスが起きるから怖くて最近は仕事だと GPT-5.5 ばっか使ってます。

しとちゃ！🦊🍮@nemumusitocha

これもそうだし、コンテキスト重なってない状態でも、Opusたまに日本語ぶっ壊れる？なんだから、claudeどうしちゃったのだ？感が正直あるん。悪いモデルとは思わないなんだけど、なんかちょっと使うの躊躇うというかなーん。。

日本語

5

3

76

12.2K

hiromi maeo@enhanced_jp·4h

これは確かにそう。なので、フェーズ/タスク分解して、キリのいいところでのコンパクションを徹底してる。コードに関してもcodex:rescueでレビューするようにしてる。しかし最近、生成された文章が「？お前何言ってんの？」となることも多く、結果手戻りが多いのが気になるところ。

Opus 4.8 、基本的には良いモデルだと思うんだけど、これは Claude 全般に言えることだけど、コンテキストが積み重なると一気に理解の解像度が落ちる。社内の人間とお客さんを混同したりし始める。柔軟な一方で、理解が大雑把。 GPT-5.5 よりもはるかに「ありえない勘違い」の頻度が高い。一方で。GPTはカッチリで正確だけど、ちょっと近視眼的だったりする。自分の中では、自分の進め方に自信のあるタスクならGPTに、なんかよくわかんねぇから一旦雰囲気で進めるか、みたいなのは Claude でやってる。

日本語

56% chance the government rescinds the Fable 5 foreigner ban by the end of the month. polymarket.com/event/us-gover…

1

5

3.6K

hiromi maeo@enhanced_jp·13h

一度便利さを知ると、不便さには戻れんのや。頼みます。

Polymarket@Polymarket

日本語

2

290

hiromi maeo@enhanced_jp·13h

@mitsunowa_X ありがとうございます。これ、私の本業であるブランド構築やブランドデザイン領域でも全く同じことが言えますね。

日本語

40

ミツノワ｜医師x市民開発者　「精介AI」発起人@mitsunowa_X·14h

素晴らしい考察をありがとうございます。私の環境には資料にある「Provenance Graph（地図）」が決定的に欠けていることにも気づかされました。ルール・チェック・実行の横断的な繋がりが追跡できて初めて、統治は完成する。次の一歩が明確になりました。そしてこの「AIの統治（ガバナンス）」の思想を、私が導入を模索している【医療AI（特に精神科など）】の現場にスライドして考えると、市民開発者として全く逆のベクトルが必要になるな、と感じています。開発環境では「AIを自律させ、人間を律速から外す」ための三権分立ですが、医療現場では患者の認識や現場スタッフの「心理的安全性」を確保するため、最初はひと手間を補助する黒子から入り、次世代にどれだけAIが発展しても人間が主権を握る「ヒューマンファースト（Human-in-the-loop）」の設計が絶対条件になる。「AIを爆速で自律させる統治」と「人間を保護しエンパワーする統治」。対象によってガバナンスのグラデーションをどう引き分けるか、これからのAIの進化の先を考える上で極めて深い補助線をいただきました。

ビズリーチのCTOの講演資料を読んで驚いた。月間2,300億トークンをCodexで消費する組織(350人)が辿り着いた結論が、私が自分のために組んできた仕組みとほぼ同じ構造だったから。講演の核はシンプル。 — harnessは借りられる。統治は、自社で作るしかない。 harness=AIが正しく速く安全に動く足場(実行環境・文脈・ガードレール・検証ループ・観測性)。これはAnthropicやOpenAIから借りられる。でもそれだけだと「人間がフローの中にいるまま速くなる」=HITLの高速化止まり。人間が律速のまま抜け出せない。だから、ここから抜け出すには統治がいる。そこで彼らの出した答えが三権分立だった。 ●立法=何が正しいかを定義する(ルールのSSOT) ●司法=従ってるか裁く(機械チェック+LLM意味判定) ●行政=実際に実行する(workflow/agent) そして全部を、人間しか改正できない憲法が縛る。で、改めて自分のシステムを見たらほぼ全部あった。ルール群=立法、Phase 5.5のゲート=司法、複数体のagent=行政、Design Constitution=憲法。司法を「Grep/ASTの決定論チェック+LLMの意味判定」に二層化してるところまで一致してて、これは正直驚いた。特に「書かれてるだけ」を許さない構造に関して。 ADRやWikiに書いてもagentは参照しないし、違反しても誰も止めない。だから、うちの環境ではCIが落ちる・hookがEdit自体を止める仕組み。そして、「書かれている」と「効いている」は別物 — これが資料で一番刺さったところ。 === ここまでが一致の話。ここからはうちの環境の穴。資料には2つのグラフが出てくる。ルールとチェックを双方向に繋ぐAuthority Provenance Graphと、機能→仕様→テストを追うSpecification Provenance Graph。うちの環境にはこれが無い。つまり効かせるゲートは持ってるのに、ルール↔チェック↔実行を横断で追跡する地図が無いんよな。だから「チェックはあるが何のルールに依拠してるか不明」みたいな断絶を、機械的には検知できない。統治は、止められるだけじゃ足りない。繋がりを追跡できて初めて完成するんじゃないか、と。とりあえず次に埋めるのはそこ。

日本語

"They screwed us": Personality clashes sent Anthropic's models offline axios.com/2026/06/15/ant…

2

3

132

hiromi maeo@enhanced_jp·17h

うーん、Fableの復活どうなることやら。ますます事態が複雑化してる。

Axios@axios

日本語

1

292

hiromi maeo@enhanced_jp·22h

@suna_gaku マジすか。じゃこまめに出していこうかしら。色々情報ストックできてるし。

日本語

0

1

29

スナガク@suna_gaku·22h

@enhanced_jp めっちゃ勉強になりました…！！！

日本語

0

1

98

hiromi maeo@enhanced_jp·23h

なんだかプチバズってて驚いた。こういう情報、需要あるんかしら。

ビズリーチのCTOの講演資料を読んで驚いた。月間2,300億トークンをCodexで消費する組織(350人)が辿り着いた結論が、私が自分のために組んできた仕組みとほぼ同じ構造だったから。講演の核はシンプル。 — harnessは借りられる。統治は、自社で作るしかない。 harness=AIが正しく速く安全に動く足場(実行環境・文脈・ガードレール・検証ループ・観測性)。これはAnthropicやOpenAIから借りられる。でもそれだけだと「人間がフローの中にいるまま速くなる」=HITLの高速化止まり。人間が律速のまま抜け出せない。だから、ここから抜け出すには統治がいる。そこで彼らの出した答えが三権分立だった。 ●立法=何が正しいかを定義する(ルールのSSOT) ●司法=従ってるか裁く(機械チェック+LLM意味判定) ●行政=実際に実行する(workflow/agent) そして全部を、人間しか改正できない憲法が縛る。で、改めて自分のシステムを見たらほぼ全部あった。ルール群=立法、Phase 5.5のゲート=司法、複数体のagent=行政、Design Constitution=憲法。司法を「Grep/ASTの決定論チェック+LLMの意味判定」に二層化してるところまで一致してて、これは正直驚いた。特に「書かれてるだけ」を許さない構造に関して。 ADRやWikiに書いてもagentは参照しないし、違反しても誰も止めない。だから、うちの環境ではCIが落ちる・hookがEdit自体を止める仕組み。そして、「書かれている」と「効いている」は別物 — これが資料で一番刺さったところ。 === ここまでが一致の話。ここからはうちの環境の穴。資料には2つのグラフが出てくる。ルールとチェックを双方向に繋ぐAuthority Provenance Graphと、機能→仕様→テストを追うSpecification Provenance Graph。うちの環境にはこれが無い。つまり効かせるゲートは持ってるのに、ルール↔チェック↔実行を横断で追跡する地図が無いんよな。だから「チェックはあるが何のルールに依拠してるか不明」みたいな断絶を、機械的には検知できない。統治は、止められるだけじゃ足りない。繋がりを追跡できて初めて完成するんじゃないか、と。とりあえず次に埋めるのはそこ。

日本語