hiromi maeo

13K posts

hiromi maeo banner
hiromi maeo

hiromi maeo

@enhanced_jp

AI×ブランド設計×デザイン | 企業の思想から「意味→構造→形」を導くブランドアーキテクト | Past: DFA Silver | Aʼ Design Silver | Behance Featured▶︎https://t.co/xiNTHY3mr2

Tokyo, meguroku Inscrit le Haziran 2007
609 Abonnements1.3K Abonnés
hiromi maeo
hiromi maeo@enhanced_jp·
うお!? 緊急地震速報久しぶりに鳴った。
日本語
0
0
0
29
hiromi maeo
hiromi maeo@enhanced_jp·
イベント: Design is Dead 〜848回目のデザイン。〜 にやってきた。 参加者は皆真っ黒。 #design_is_dead
hiromi maeo tweet media
日本語
0
0
2
93
hiromi maeo
hiromi maeo@enhanced_jp·
ビズリーチの資料からわかった2つの穴。 これを埋める実装が完了した。今はCIで実際に動いてる。あくまでうちの環境での話だけど、参考になれば幸い。 この仕組みをひとことで言うと、「ルール・仕様が、ちゃんと実物(チェック/コード/テスト)に裏打ちされているか」を機械が追えるようにして、裏打ちが切れたらCIで止めるというもの。 === 大前提: うちの環境のgovernance(守るべきルール群)は、これまで「散文で書かれたルール」と「あちこちに散らばったチェックの仕組み」がバラバラのファイル群になってて、その繋がりを機械的に追いづらかった。 これは、法律(ルール)は文章で書いてあるのに、それを実際に取り締まる警察(チェック)が本当に存在するか、誰も確認していない状態ということに他ならない。 穴① APG: 散文のルールと実際のチェックが繋がっていなかった。 これを放置すると、 ●立法なき司法(orphan):存在しないルールをチェックしている ●司法なき立法(unenforced):機械チェックできるルールなのに誰も見ていない ということが起きる。なので、ルール ⇄ チェックのリンクをグラフ化してCIで検証する。 === 穴② SPG: 仕様と実装とテストが繋がっていなかった。 放置すると、 ●仕様だけあって実装がない ●実装はあるが守るテストがない ●仕様が参照するコードが実在しない これがいわゆるポチョムキン実装の温床になる。 ↑実のところ、これがよく発生してた。 特に長い時間実装をやってると起きやすかった。 後日別セッションでその実装を調べると、仕様書はあるのに実体がないとかね。 回避するため、rulesに「お前ふざけるなよ!このボケ。ポチョムキン実装は絶対にやるな!!」とパワハラ気味に厳格に書き込んでたんだけど、今回ちゃんと仕組み化した。 なので、仕様 ⇄ 実装 ⇄ テスト(@proves)のリンクをグラフ化してCIで検証する。 テストを消して来歴が切れる変更も検出する。 === 設計の肝は2つ。 1. グラフをSSOTにしない グラフは毎回、マーカーやテスト宣言から再生成する索引。手でグラフを書き換えて誤魔化せない。 2. 正直バルブ 機械で確証できるものはCIで止める。 辿れないものは「未確認」として警告に留める。 嘘の確信でブロックしない。 細かい厳格化はまだ調整中だけど、コアは入った。 散文のルールを「守っているつもり」から、実体との接続をCIが追える状態にできたと思う。多分。
hiromi maeo tweet mediahiromi maeo tweet media
hiromi maeo@enhanced_jp

ビズリーチのCTOの講演資料を読んで驚いた。 月間2,300億トークンをCodexで消費する組織(350人)が辿り着いた結論が、私が自分のために組んできた仕組みとほぼ同じ構造だったから。 講演の核はシンプル。 — harnessは借りられる。統治は、自社で作るしかない。 harness=AIが正しく速く安全に動く足場(実行環境・文脈・ガードレール・検証ループ・観測性)。これはAnthropicやOpenAIから借りられる。でもそれだけだと「人間がフローの中にいるまま速くなる」=HITLの高速化止まり。人間が律速のまま抜け出せない。 だから、ここから抜け出すには統治がいる。 そこで彼らの出した答えが三権分立だった。 ●立法=何が正しいかを定義する(ルールのSSOT) ●司法=従ってるか裁く(機械チェック+LLM意味判定) ●行政=実際に実行する(workflow/agent) そして全部を、人間しか改正できない憲法が縛る。 で、改めて自分のシステムを見たらほぼ全部あった。 ルール群=立法、Phase 5.5のゲート=司法、複数体のagent=行政、Design Constitution=憲法。 司法を「Grep/ASTの決定論チェック+LLMの意味判定」に二層化してるところまで一致してて、これは正直驚いた。 特に「書かれてるだけ」を許さない構造に関して。 ADRやWikiに書いてもagentは参照しないし、違反しても誰も止めない。だから、うちの環境ではCIが落ちる・hookがEdit自体を止める仕組み。 そして、「書かれている」と「効いている」は別物 — これが資料で一番刺さったところ。 === ここまでが一致の話。ここからはうちの環境の穴。 資料には2つのグラフが出てくる。ルールとチェックを双方向に繋ぐAuthority Provenance Graphと、機能→仕様→テストを追うSpecification Provenance Graph。うちの環境にはこれが無い。 つまり効かせるゲートは持ってるのに、ルール↔チェック↔実行を横断で追跡する地図が無いんよな。 だから「チェックはあるが何のルールに依拠してるか不明」みたいな断絶を、機械的には検知できない。 統治は、止められるだけじゃ足りない。繋がりを追跡できて初めて完成するんじゃないか、と。 とりあえず次に埋めるのはそこ。

日本語
0
1
1
272
hiromi maeo
hiromi maeo@enhanced_jp·
@kgsi そう。だからもうデザイナーとは言えないかもw 何やってるかわからない人になってます。
日本語
0
0
1
15
こぎそ
こぎそ@kgsi·
@enhanced_jp わかる、AI触るのが楽しくってそっちばかりに目が行きがち問題
日本語
1
0
1
38
こぎそ
こぎそ@kgsi·
デザイナーにスコープ絞って、Claude MaxプランかChat GPT Proプランを契約してないと入れない勉強会イベントとかやったらどれぐらいきてくれるんだろ。濃ゆいイベントにはなると思うが母数がどの程度いるか気になる🤔 コレ読んで🖐️ってひと、リプ欲しい。
日本語
6
1
41
5.1K
hiromi maeo
hiromi maeo@enhanced_jp·
Claude Codeの98%はAIじゃない。 この投稿に関して、面白そうだったのでarXivの元論文(arXiv:2604.14228)まで当たってみた。 論文自体は実在するし、わりと真面目な工学比較研究。 核が単純なwhileループで、コードの大半は周辺システム — 権限モードにML分類器、多段のコンテキスト圧縮、worktree隔離のサブエージェント。ここは本当。 引っかかったのは投稿の結論のほう。 「みんなが良いモデルを競ってる中、Anthropicだけが正反対にインフラの要塞を築いた」という部分。 これ、要塞を築くのはAnthropicの逆張りじゃなくて、エージェント道具を作る全員の通り道であって、OpenAIのCodex CLIもGoogleのGemini CLIも、モデルも作りつつ決定論ソフトを分厚く被せてる。 両方オープンソースだから開けば分かる。 まったく同じ構造ってわけじゃないけど、同じ設計課題(権限・サンドボックス・サブエージェント・チェックポイント)に似た部品で答えてるはず。 比べるなら道具は道具と — Claude Codeの隣に置くのはCodex CLIやGeminiCLIで、地続きの差はあっても「Anthropicだけが反対を向いた」事実はないんじゃないかな。 === もうひとつ、1.6%がAIって数字。 これはコード量の話であって、価値の所在じゃない。 数字だけで見るとインパクトあるけどね。 正確には、AIの判断に関わるコードが推定1.6%ってことで、モデル呼び出しの行を数えた値じゃない。 残りの98.4%は、その頭脳を暴走させずに使い切るための器 — 権限の番人、膨らむ文脈の圧縮、サブエージェントの隔離などなどに使われてる。 だから、コードの割合が小さい=貢献が小さいわけじゃない。 モデルが賢さの上限を決めて、周りの工学がその賢さをどれだけ落とさず引き出せるかを決める。だから賢いモデルを取りこぼさず引き出すためには工学が要る。 これは自分でループを組んでて毎日実感してる部分。 賢いモデルを置いただけじゃ、ブレーキがないから止まるべき所で止まらないし、文脈もすぐ溢れる。 ハーネスを分厚くするのは、モデルの性能を諦めたからじゃなくて、その賢さを一滴も取りこぼさないためでもある。 まあ、このあたりは次のフロンティアモデルでも生きてくるはず。Fable使ったときも思ったけど。 しかし、Opus 4.8はたまにそれを超えるやらかしをするときもあるのはやや残念ではある。
hiromi maeo tweet media
How To Prompt@HowToPrompt__

Researchers show that Claude Code is 98% not AI. Anthropic never gave us the architecture for Claude Code. There were no docs. Just a tool that every developer is currently obsessing over. Until it leaked recently. A research team pulled the source code, analyzed all 500,000 lines, and found something ridiculous. Only 1.6% of the codebase actually interacts with the AI model. The core of Claude Code is literally just a simple while-loop. It asks the model what to do, runs a tool, and repeats. So what is the other 98.4%? It is hardcore, traditional software engineering. The researchers found a massive, complex infrastructure designed entirely to babysit the AI and keep it from hallucinating or destroying your computer: - A 7-mode permission system acting as a security bouncer. - A 5-layer context compaction pipeline so the AI doesn't forget its goal. - A subagent delegation mechanism with strict worktree isolation. - Four different extensibility hooks to manage external tools safely. Every startup right now is trying to build a better AI model to get better results. Anthropic did the exact opposite. They took an existing model and built a fortress of deterministic software around it. They realized that the AI doesn't need to be smarter. It needs to be managed.

日本語
1
1
5
1.4K
hiromi maeo
hiromi maeo@enhanced_jp·
@kgsi ちょっとデザイナーの皆さんから色々吸収したいっす。 ずっとClaudeCodeの仕組みの部分ばかり触ってたので、正直アウトプットの部分がおざなりになってるので。
日本語
1
0
1
46
こぎそ
こぎそ@kgsi·
@enhanced_jp まえおさんは間違いなく来てくれるって信じてる🤗
日本語
1
0
1
220
hiromi maeo
hiromi maeo@enhanced_jp·
@kgsi そうなんですよね。 ブランドとして信頼感損なう行為だなぁと。 とりあえずcodexの方がOpus4.8よりも信頼性が高いので載せ替え変えれる分は変更作業してます。
日本語
1
0
1
78
こぎそ
こぎそ@kgsi·
@enhanced_jp もう一回使おうってなりにくいですわよね。
日本語
1
0
1
114
hiromi maeo
hiromi maeo@enhanced_jp·
うちにもclaude -p/Agent SDK従量クレジット枠の件の延期メールが来てた。 昨日追加でより詳細に調べたら、まだまだclaude -pを使ってた部分があったので、早めに対策しておこう。 しかし、こんなことで振り回されてリソース割かれるのは面倒すぎる。
hiromi maeo tweet media
hiromi maeo@enhanced_jp

今日からclaude -p/Agent SDKが従量クレジット枠に変わるみたい。 とはいえ作業の主軸は無料据え置きの対話モードで、headless利用も軽い設計なので影響はほぼゼロ。 重い無人headlessを常用してなかったので今のところ安心。 「お金使わない実装しろ」とClaudeCodeに宣言しておいてよかった🌝 support.claude.com/ja/articles/15…

日本語
1
0
1
504
hiromi maeo
hiromi maeo@enhanced_jp·
表現生成においては平均化しないよう、Anti-banal(凡庸化回避)の仕組みを使ってる。 AIが出してくる第一連想は凡庸の最たるものとも言える。これはFableとも話した帰結。特にブランド構築においては、凡庸=失敗みたいなとこあるので、この仕組みは結構前から組み込んでる。 とは言え結局のところ、生成されたものが凡庸かどうかを判断するのは人間でしかないので、あくまでも気休めなんだけど。
만원만 l manwonman@quietcomp_

[디자인의 미래는 이 리포트를 보면 끝난다] 디자이너라면 한 번쯤 들어봤을 iF Design에서 디자인 트렌드 리포트가 나오고 있었다는 거 알고 계셨나요 올해 리포트에서 가장 흥미로운 부분은 AI 자체보다, AI가 만들어내는 '평균화'와 '차별화'의 충돌을 다룬다는 점입니다. 누구나 비슷한 툴을 쓰고 비슷한 결과물을 만들 수 있는 시대가 되면서, 오히려 독창성과 개성이 더 중요한 경쟁력이 되고 있다는 것이죠. 이 외에도 1. 편리함을 추구하는 문화 vs 직접 배우고 만드는 문화 2. 자연과 기술이 결합하는 새로운 생태계 3. 도시를 커뮤니티 중심으로 재해석하는 움직임 등 디자인을 넘어 사회 전반의 변화를 함께 다루고 있습니다. 흥미로운 건 이제 디자인 트렌드가 색상이나 스타일이 아니라, 사람들이 앞으로 어떻게 살고, 만들고, 연결될 것인가를 다루기 시작했다는 점! ifdesign.com/en/trend-report

日本語
0
1
2
278
hiromi maeo
hiromi maeo@enhanced_jp·
@super_bonochin ですです。 昨日はスキルに入れてる私の口調で回答し始めたり笑 お前、これまでそんなことなかったやんか…と。
日本語
0
0
1
30
炎鎮🔥 - ₿onochin -
炎鎮🔥 - ₿onochin -@super_bonochin·
Opus 最近どうしちゃったの?ってマジで思いますわ。同じような意見をすごく多く見かける。 いきなりエグいミスが起きるから怖くて最近は仕事だと GPT-5.5 ばっか使ってます。
しとちゃ!🦊🍮@nemumusitocha

これもそうだし、コンテキスト重なってない状態でも、Opusたまに日本語ぶっ壊れる?なんだから、claudeどうしちゃったのだ?感が正直あるん。悪いモデルとは思わないなんだけど、なんかちょっと使うの躊躇うというかなーん。。

日本語
5
3
93
15.8K