hiromi maeo

13K posts

hiromi maeo

@enhanced_jp

AI×ブランド設計×デザイン | 企業の思想から「意味→構造→形」を導くブランドアーキテクト | Past: DFA Silver | Aʼ Design Silver | Behance Featured▶︎https://t.co/xiNTHY3mr2

Tokyo, meguroku Inscrit le Haziran 2007

609 Abonnements1.3K Abonnés

hiromi maeo@enhanced_jp·35m

うお！？緊急地震速報久しぶりに鳴った。

日本語

hiromi maeo@enhanced_jp·1h

イベント: Design is Dead 〜848回目のデザイン。〜にやってきた。参加者は皆真っ黒。 #design_is_dead

日本語

hiromi maeo@enhanced_jp·2h

ビズリーチの資料からわかった2つの穴。これを埋める実装が完了した。今はCIで実際に動いてる。あくまでうちの環境での話だけど、参考になれば幸い。この仕組みをひとことで言うと、「ルール・仕様が、ちゃんと実物（チェック/コード/テスト）に裏打ちされているか」を機械が追えるようにして、裏打ちが切れたらCIで止めるというもの。 === 大前提：うちの環境のgovernance（守るべきルール群）は、これまで「散文で書かれたルール」と「あちこちに散らばったチェックの仕組み」がバラバラのファイル群になってて、その繋がりを機械的に追いづらかった。これは、法律（ルール）は文章で書いてあるのに、それを実際に取り締まる警察（チェック）が本当に存在するか、誰も確認していない状態ということに他ならない。穴① APG：散文のルールと実際のチェックが繋がっていなかった。これを放置すると、 ●立法なき司法（orphan）：存在しないルールをチェックしている ●司法なき立法（unenforced）：機械チェックできるルールなのに誰も見ていないということが起きる。なので、ルール ⇄ チェックのリンクをグラフ化してCIで検証する。 === 穴② SPG: 仕様と実装とテストが繋がっていなかった。放置すると、 ●仕様だけあって実装がない ●実装はあるが守るテストがない ●仕様が参照するコードが実在しないこれがいわゆるポチョムキン実装の温床になる。 ↑実のところ、これがよく発生してた。特に長い時間実装をやってると起きやすかった。後日別セッションでその実装を調べると、仕様書はあるのに実体がないとかね。回避するため、rulesに「お前ふざけるなよ！このボケ。ポチョムキン実装は絶対にやるな！！」とパワハラ気味に厳格に書き込んでたんだけど、今回ちゃんと仕組み化した。なので、仕様 ⇄ 実装 ⇄ テスト（@proves）のリンクをグラフ化してCIで検証する。テストを消して来歴が切れる変更も検出する。 === 設計の肝は2つ。 1. グラフをSSOTにしないグラフは毎回、マーカーやテスト宣言から再生成する索引。手でグラフを書き換えて誤魔化せない。 2. 正直バルブ機械で確証できるものはCIで止める。辿れないものは「未確認」として警告に留める。嘘の確信でブロックしない。細かい厳格化はまだ調整中だけど、コアは入った。散文のルールを「守っているつもり」から、実体との接続をCIが追える状態にできたと思う。多分。

hiromi maeo@enhanced_jp

ビズリーチのCTOの講演資料を読んで驚いた。月間2,300億トークンをCodexで消費する組織(350人)が辿り着いた結論が、私が自分のために組んできた仕組みとほぼ同じ構造だったから。講演の核はシンプル。 — harnessは借りられる。統治は、自社で作るしかない。 harness=AIが正しく速く安全に動く足場(実行環境・文脈・ガードレール・検証ループ・観測性)。これはAnthropicやOpenAIから借りられる。でもそれだけだと「人間がフローの中にいるまま速くなる」=HITLの高速化止まり。人間が律速のまま抜け出せない。だから、ここから抜け出すには統治がいる。そこで彼らの出した答えが三権分立だった。 ●立法=何が正しいかを定義する(ルールのSSOT) ●司法=従ってるか裁く(機械チェック+LLM意味判定) ●行政=実際に実行する(workflow/agent) そして全部を、人間しか改正できない憲法が縛る。で、改めて自分のシステムを見たらほぼ全部あった。ルール群=立法、Phase 5.5のゲート=司法、複数体のagent=行政、Design Constitution=憲法。司法を「Grep/ASTの決定論チェック+LLMの意味判定」に二層化してるところまで一致してて、これは正直驚いた。特に「書かれてるだけ」を許さない構造に関して。 ADRやWikiに書いてもagentは参照しないし、違反しても誰も止めない。だから、うちの環境ではCIが落ちる・hookがEdit自体を止める仕組み。そして、「書かれている」と「効いている」は別物 — これが資料で一番刺さったところ。 === ここまでが一致の話。ここからはうちの環境の穴。資料には2つのグラフが出てくる。ルールとチェックを双方向に繋ぐAuthority Provenance Graphと、機能→仕様→テストを追うSpecification Provenance Graph。うちの環境にはこれが無い。つまり効かせるゲートは持ってるのに、ルール↔チェック↔実行を横断で追跡する地図が無いんよな。だから「チェックはあるが何のルールに依拠してるか不明」みたいな断絶を、機械的には検知できない。統治は、止められるだけじゃ足りない。繋がりを追跡できて初めて完成するんじゃないか、と。とりあえず次に埋めるのはそこ。

日本語

272

hiromi maeo@enhanced_jp·4h

Fable=戦略物資

Chubby♨️@kimmonismus

New update on Fable 5: and it's less about jailbreaks than anyone initially thought. Via Axios The Axios story that just dropped today reframes the whole thing: Anthropic hired a cybersecurity expert to review Amazon's findings and push back on the government's narrative. The administration viewed her as a "radical Democrat." She was then publicly celebrated by Chris Krebs, the official Trump just fired. That didn't help. Behind the scenes, officials describe a company that simply doesn't know how to talk to this administration. "It's like they just speak different languages," one source said. "Everybody said Anthropic was a bad actor. Some of us said it was time to give them a chance. Now those people are questioning that. They screwed us." Today: Anthropic staffers meet with Commerce, the CIA, and White House science advisor Michael Kratsios to work through compliance with the cyber executive order. The technical question - can Fable 5 be jailbroken - is almost secondary now. This is a story about a company that keeps losing the room. Ill keep you updated.

日本語

110

hiromi maeo@enhanced_jp·5h

@kgsi そう。だからもうデザイナーとは言えないかもw 何やってるかわからない人になってます。

日本語

こぎそ@kgsi·6h

@enhanced_jp わかる、AI触るのが楽しくってそっちばかりに目が行きがち問題

日本語

こぎそ@kgsi·6h

デザイナーにスコープ絞って、Claude MaxプランかChat GPT Proプランを契約してないと入れない勉強会イベントとかやったらどれぐらいきてくれるんだろ。濃ゆいイベントにはなると思うが母数がどの程度いるか気になる🤔 コレ読んで🖐️ってひと、リプ欲しい。

日本語

5.1K

hiromi maeo@enhanced_jp·5h

元論文 arxiv.org/pdf/2604.14228

日本語

hiromi maeo@enhanced_jp·5h

Claude Codeの98%はAIじゃない。この投稿に関して、面白そうだったのでarXivの元論文（arXiv:2604.14228）まで当たってみた。論文自体は実在するし、わりと真面目な工学比較研究。核が単純なwhileループで、コードの大半は周辺システム — 権限モードにML分類器、多段のコンテキスト圧縮、worktree隔離のサブエージェント。ここは本当。引っかかったのは投稿の結論のほう。「みんなが良いモデルを競ってる中、Anthropicだけが正反対にインフラの要塞を築いた」という部分。これ、要塞を築くのはAnthropicの逆張りじゃなくて、エージェント道具を作る全員の通り道であって、OpenAIのCodex CLIもGoogleのGemini CLIも、モデルも作りつつ決定論ソフトを分厚く被せてる。両方オープンソースだから開けば分かる。まったく同じ構造ってわけじゃないけど、同じ設計課題（権限・サンドボックス・サブエージェント・チェックポイント）に似た部品で答えてるはず。比べるなら道具は道具と — Claude Codeの隣に置くのはCodex CLIやGeminiCLIで、地続きの差はあっても「Anthropicだけが反対を向いた」事実はないんじゃないかな。 === もうひとつ、1.6%がAIって数字。これはコード量の話であって、価値の所在じゃない。数字だけで見るとインパクトあるけどね。正確には、AIの判断に関わるコードが推定1.6%ってことで、モデル呼び出しの行を数えた値じゃない。残りの98.4%は、その頭脳を暴走させずに使い切るための器 — 権限の番人、膨らむ文脈の圧縮、サブエージェントの隔離などなどに使われてる。だから、コードの割合が小さい=貢献が小さいわけじゃない。モデルが賢さの上限を決めて、周りの工学がその賢さをどれだけ落とさず引き出せるかを決める。だから賢いモデルを取りこぼさず引き出すためには工学が要る。これは自分でループを組んでて毎日実感してる部分。賢いモデルを置いただけじゃ、ブレーキがないから止まるべき所で止まらないし、文脈もすぐ溢れる。ハーネスを分厚くするのは、モデルの性能を諦めたからじゃなくて、その賢さを一滴も取りこぼさないためでもある。まあ、このあたりは次のフロンティアモデルでも生きてくるはず。Fable使ったときも思ったけど。しかし、Opus 4.8はたまにそれを超えるやらかしをするときもあるのはやや残念ではある。

How To Prompt@HowToPrompt__

Researchers show that Claude Code is 98% not AI. Anthropic never gave us the architecture for Claude Code. There were no docs. Just a tool that every developer is currently obsessing over. Until it leaked recently. A research team pulled the source code, analyzed all 500,000 lines, and found something ridiculous. Only 1.6% of the codebase actually interacts with the AI model. The core of Claude Code is literally just a simple while-loop. It asks the model what to do, runs a tool, and repeats. So what is the other 98.4%? It is hardcore, traditional software engineering. The researchers found a massive, complex infrastructure designed entirely to babysit the AI and keep it from hallucinating or destroying your computer: - A 7-mode permission system acting as a security bouncer. - A 5-layer context compaction pipeline so the AI doesn't forget its goal. - A subagent delegation mechanism with strict worktree isolation. - Four different extensibility hooks to manage external tools safely. Every startup right now is trying to build a better AI model to get better results. Anthropic did the exact opposite. They took an existing model and built a fortress of deterministic software around it. They realized that the AI doesn't need to be smarter. It needs to be managed.

日本語

1.4K

hiromi maeo@enhanced_jp·6h

@kgsi ちょっとデザイナーの皆さんから色々吸収したいっす。ずっとClaudeCodeの仕組みの部分ばかり触ってたので、正直アウトプットの部分がおざなりになってるので。

日本語

こぎそ@kgsi·6h

@enhanced_jp まえおさんは間違いなく来てくれるって信じてる🤗

日本語

220

hiromi maeo@enhanced_jp·6h

@kgsi そうなんですよね。ブランドとして信頼感損なう行為だなぁと。とりあえずcodexの方がOpus4.8よりも信頼性が高いので載せ替え変えれる分は変更作業してます。

日本語

こぎそ@kgsi·7h

@enhanced_jp もう一回使おうってなりにくいですわよね。

日本語

114

hiromi maeo@enhanced_jp·7h

うちにもclaude -p/Agent SDK従量クレジット枠の件の延期メールが来てた。昨日追加でより詳細に調べたら、まだまだclaude -pを使ってた部分があったので、早めに対策しておこう。しかし、こんなことで振り回されてリソース割かれるのは面倒すぎる。

hiromi maeo@enhanced_jp

今日からclaude -p/Agent SDKが従量クレジット枠に変わるみたい。とはいえ作業の主軸は無料据え置きの対話モードで、headless利用も軽い設計なので影響はほぼゼロ。重い無人headlessを常用してなかったので今のところ安心。「お金使わない実装しろ」とClaudeCodeに宣言しておいてよかった🌝 support.claude.com/ja/articles/15…

日本語

504

hiromi maeo@enhanced_jp·7h

HiggsfieldのPhotoshopプラグインはなかなか良さそう。ちょっと試してみる。

Higgsfield AI 🧩@higgsfield

Higgsfield Plugin for Photoshop is live. 1. Real Time turns your sketch into a finished image as you draw, in any style. 2. Decompose any image into editable layers. 3. Restyle any photo with a preset or prompt. Your whole creative pipeline, inside Photoshop.

日本語

108

hiromi maeo@enhanced_jp·7h

@suna_gaku Geminiはまあ、うん…

日本語

スナガク@suna_gaku·12h

Gemini は、きっとこれから進化する… 知らんけど…

Tyler@rezoundous

feeling opus 4.8 or gpt 5.5 isn't good? go use gemini for 5 minutes.

日本語

hiromi maeo@enhanced_jp·7h

表現生成においては平均化しないよう、Anti-banal（凡庸化回避）の仕組みを使ってる。 AIが出してくる第一連想は凡庸の最たるものとも言える。これはFableとも話した帰結。特にブランド構築においては、凡庸＝失敗みたいなとこあるので、この仕組みは結構前から組み込んでる。とは言え結局のところ、生成されたものが凡庸かどうかを判断するのは人間でしかないので、あくまでも気休めなんだけど。

만원만 l manwonman@quietcomp_

[디자인의 미래는 이 리포트를 보면 끝난다] 디자이너라면 한 번쯤 들어봤을 iF Design에서 디자인 트렌드 리포트가 나오고 있었다는 거 알고 계셨나요 올해 리포트에서 가장 흥미로운 부분은 AI 자체보다, AI가 만들어내는 '평균화'와 '차별화'의 충돌을 다룬다는 점입니다. 누구나 비슷한 툴을 쓰고 비슷한 결과물을 만들 수 있는 시대가 되면서, 오히려 독창성과 개성이 더 중요한 경쟁력이 되고 있다는 것이죠. 이 외에도 1. 편리함을 추구하는 문화 vs 직접 배우고 만드는 문화 2. 자연과 기술이 결합하는 새로운 생태계 3. 도시를 커뮤니티 중심으로 재해석하는 움직임 등 디자인을 넘어 사회 전반의 변화를 함께 다루고 있습니다. 흥미로운 건 이제 디자인 트렌드가 색상이나 스타일이 아니라, 사람들이 앞으로 어떻게 살고, 만들고, 연결될 것인가를 다루기 시작했다는 점! ifdesign.com/en/trend-report

日本語

278

hiromi maeo@enhanced_jp·8h

@super_bonochin ですです。昨日はスキルに入れてる私の口調で回答し始めたり笑お前、これまでそんなことなかったやんか…と。

日本語

炎鎮🔥 - ₿onochin -@super_bonochin·8h

マジで何かがおかしいですよね最近 x.com/i/status/20667…

hiromi maeo@enhanced_jp

これは確かにそう。なので、フェーズ/タスク分解して、キリのいいところでのコンパクションを徹底してる。コードに関してもcodex:rescueでレビューするようにしてる。しかし最近、生成された文章が「？お前何言ってんの？」となることも多く、結果手戻りが多いのが気になるところ。

日本語

炎鎮🔥 - ₿onochin -@super_bonochin·8h

Opus 最近どうしちゃったの？ってマジで思いますわ。同じような意見をすごく多く見かける。いきなりエグいミスが起きるから怖くて最近は仕事だと GPT-5.5 ばっか使ってます。

しとちゃ！🦊🍮@nemumusitocha

これもそうだし、コンテキスト重なってない状態でも、Opusたまに日本語ぶっ壊れる？なんだから、claudeどうしちゃったのだ？感が正直あるん。悪いモデルとは思わないなんだけど、なんかちょっと使うの躊躇うというかなーん。。

日本語

15.8K

hiromi maeo@enhanced_jp·8h

炎鎮🔥 - ₿onochin -@super_bonochin

Opus 4.8 、基本的には良いモデルだと思うんだけど、これは Claude 全般に言えることだけど、コンテキストが積み重なると一気に理解の解像度が落ちる。社内の人間とお客さんを混同したりし始める。柔軟な一方で、理解が大雑把。 GPT-5.5 よりもはるかに「ありえない勘違い」の頻度が高い。一方で。GPTはカッチリで正確だけど、ちょっと近視眼的だったりする。自分の中では、自分の進め方に自信のあるタスクならGPTに、なんかよくわかんねぇから一旦雰囲気で進めるか、みたいなのは Claude でやってる。

日本語

4.5K

Découvrir

@proves @kgsi @suna_gaku @super_bonochin @elonmusk @BarackObama @taylorswift13 @cristiano