hiromi maeo

13K posts

hiromi maeo

@enhanced_jp

AI×ブランド設計×デザイン | 企業の思想から「意味→構造→形」を導くブランドアーキテクト | Past: DFA Silver | Aʼ Design Silver | Behance Featured▶︎https://t.co/xiNTHY3mr2

Tokyo, meguroku Присоединился Haziran 2007

612 Подписки1.3K Подписчики

hiromi maeo@enhanced_jp·18m

調べてみたら、既にうちの環境に入れてるGitNexusと同じ役割でより上位の機能を持ってた。ただし、配送方法に良い知見があった。 GitNexusをPreToolUse hookに配線すれば、Grep/Glob横取りやimpact自動注入を決定論化できる。現状CLAUDE.mdに規律依存で記述してたけど、配線を変えるだけで、ツールを替えずにdeterministicに格上げできる事がわかった。 codebase-memory-mcpから得られた転用可能インサイトがこれ。 GitNexus入れてない人には有益かも。

hiromi maeo@enhanced_jp

これは良さそうなアイデア。ちょっと分析してみる。

日本語

hiromi maeo@enhanced_jp·2h

@kgsi こちらこそですー。

日本語

こぎそ@kgsi·2h

@enhanced_jp 改めて今日はありがとうございました！

日本語

hiromi maeo@enhanced_jp·2h

デザインは死なないよ。在り方は変わるかもしれないけど。みんな黒服の中、いきなり緊急地震速報が鳴り響いたイベントでしたが、同じような課題感を感じることができて面白かった。 #design_is_dead

こぎそ@kgsi

完全なる勢いで始めたファインディ主宰のイベント”Design is Dead”ですが、黒服率100%、質問もめちゃくちゃ来た驚異のイベントとなりました。デザインは死にません、何度でも蘇ります！ありがとうございました！ご参加頂き、ファインディメンバー共々感謝🥲🪦💐#design_is_dead

日本語

1.4K

hiromi maeo@enhanced_jp·2h

SpaceXのCursor買収の件、どんな感じに変わるかしら。しばらく使ってなかったけど、大幅にアプデされる話もあるからちょっと期待してる。

SpaceX@SpaceX

SpaceX has exercised the option to acquire @cursor_ai in an all-stock transaction with the goal of building the world’s most useful AI models. For the past few months, SpaceXAI has been jointly training a model with Cursor, which will be released in Cursor and Grok Build soon. We look forward to working closely with the Cursor team to advance our frontier AI capabilities

日本語

116

hiromi maeo@enhanced_jp·2h

@kimotuki @kenn あら、kennさん参加されてたんですね。イベント被ってました。

日本語

Yasuhiro Arai(AI駆動開発勉強会主催)@kimotuki·6h

@kenn さん講演！！ Claude Fable 5を使って見てのお話！！ #ClaudeCodeMeetup

日本語

205

hiromi maeo@enhanced_jp·2h

これは良さそうなアイデア。ちょっと分析してみる。

Charly Wargnier@DataChaz

🚨How do you index the entire Linux kernel (28M lines of code) for an AI agent in 3 minutes? You stop letting the agent read files one by one. There is a fascinating new open-source release called codebase-memory-mcp. It's a code intelligence engine that swaps traditional file-searching for high-speed AST knowledge graphs. What makes this project stand out is the research behind it. Evaluated across 31 real-world repositories (detailed in arXiv:2603.27277), the architectural shift yields massive efficiency gains: → 99% reduction in tokens for structural queries → 83% answer quality across complex tasks → 2.1x fewer tool calls required It maps functions, classes, HTTP routes, and cross-service links into a graph. When the agent needs context, it queries the graph directly. Security is prioritized too: everything happens 100% locally on your machine via a single static binary. It runs entirely locally. No Docker, no Ollama, no API keys. You download the binary, restart your agent, and it just works. Are we one good index away from cutting AI dev costs to zero? Paper and Repo links in the thread ↓

日本語

hiromi maeo@enhanced_jp·3h

@RaminNasibov 寿司、お好み焼き、ラーメン、親子丼、カレーライス

日本語

Ramin Nasibov@RaminNasibov·4h

こんにちは。おすすめの日本食、何がいいかな？💭

日本語

4.6K

hiromi maeo@enhanced_jp·3h

@kenichiota0711 Krea好きです。以前よく使ってました。

日本語

太田賢一／Design Mgr@kenichiota0711·4h

Krea Enhancerで自分の子どもの頃の写真をアップスケールした。これは、ディティールの「復元」ではなく「再構成・補完」をしている（なので少し顔が変わっている）右下のAI Strengthが33％。数値を大きくすると、AIが解釈し自由に描き足す度合いが上がる。 krea.ai/app

日本語

728

hiromi maeo@enhanced_jp·5h

うお！？緊急地震速報久しぶりに鳴った。

日本語

hiromi maeo@enhanced_jp·6h

イベント: Design is Dead 〜848回目のデザイン。〜にやってきた。参加者は皆真っ黒。 #design_is_dead

日本語

351

hiromi maeo@enhanced_jp·7h

ビズリーチの資料からわかった2つの穴。これを埋める実装が完了した。今はCIで実際に動いてる。あくまでうちの環境での話だけど、参考になれば幸い。この仕組みをひとことで言うと、「ルール・仕様が、ちゃんと実物（チェック/コード/テスト）に裏打ちされているか」を機械が追えるようにして、裏打ちが切れたらCIで止めるというもの。 === 大前提：うちの環境のgovernance（守るべきルール群）は、これまで「散文で書かれたルール」と「あちこちに散らばったチェックの仕組み」がバラバラのファイル群になってて、その繋がりを機械的に追いづらかった。これは、法律（ルール）は文章で書いてあるのに、それを実際に取り締まる警察（チェック）が本当に存在するか、誰も確認していない状態ということに他ならない。穴① APG：散文のルールと実際のチェックが繋がっていなかった。これを放置すると、 ●立法なき司法（orphan）：存在しないルールをチェックしている ●司法なき立法（unenforced）：機械チェックできるルールなのに誰も見ていないということが起きる。なので、ルール ⇄ チェックのリンクをグラフ化してCIで検証する。 === 穴② SPG: 仕様と実装とテストが繋がっていなかった。放置すると、 ●仕様だけあって実装がない ●実装はあるが守るテストがない ●仕様が参照するコードが実在しないこれがいわゆるポチョムキン実装の温床になる。 ↑実のところ、これがよく発生してた。特に長い時間実装をやってると起きやすかった。後日別セッションでその実装を調べると、仕様書はあるのに実体がないとかね。回避するため、rulesに「お前ふざけるなよ！このボケ。ポチョムキン実装は絶対にやるな！！」とパワハラ気味に厳格に書き込んでたんだけど、今回ちゃんと仕組み化した。なので、仕様 ⇄ 実装 ⇄ テスト（@proves）のリンクをグラフ化してCIで検証する。テストを消して来歴が切れる変更も検出する。 === 設計の肝は2つ。 1. グラフをSSOTにしないグラフは毎回、マーカーやテスト宣言から再生成する索引。手でグラフを書き換えて誤魔化せない。 2. 正直バルブ機械で確証できるものはCIで止める。辿れないものは「未確認」として警告に留める。嘘の確信でブロックしない。細かい厳格化はまだ調整中だけど、コアは入った。散文のルールを「守っているつもり」から、実体との接続をCIが追える状態にできたと思う。多分。

hiromi maeo@enhanced_jp

ビズリーチのCTOの講演資料を読んで驚いた。月間2,300億トークンをCodexで消費する組織(350人)が辿り着いた結論が、私が自分のために組んできた仕組みとほぼ同じ構造だったから。講演の核はシンプル。 — harnessは借りられる。統治は、自社で作るしかない。 harness=AIが正しく速く安全に動く足場(実行環境・文脈・ガードレール・検証ループ・観測性)。これはAnthropicやOpenAIから借りられる。でもそれだけだと「人間がフローの中にいるまま速くなる」=HITLの高速化止まり。人間が律速のまま抜け出せない。だから、ここから抜け出すには統治がいる。そこで彼らの出した答えが三権分立だった。 ●立法=何が正しいかを定義する(ルールのSSOT) ●司法=従ってるか裁く(機械チェック+LLM意味判定) ●行政=実際に実行する(workflow/agent) そして全部を、人間しか改正できない憲法が縛る。で、改めて自分のシステムを見たらほぼ全部あった。ルール群=立法、Phase 5.5のゲート=司法、複数体のagent=行政、Design Constitution=憲法。司法を「Grep/ASTの決定論チェック+LLMの意味判定」に二層化してるところまで一致してて、これは正直驚いた。特に「書かれてるだけ」を許さない構造に関して。 ADRやWikiに書いてもagentは参照しないし、違反しても誰も止めない。だから、うちの環境ではCIが落ちる・hookがEdit自体を止める仕組み。そして、「書かれている」と「効いている」は別物 — これが資料で一番刺さったところ。 === ここまでが一致の話。ここからはうちの環境の穴。資料には2つのグラフが出てくる。ルールとチェックを双方向に繋ぐAuthority Provenance Graphと、機能→仕様→テストを追うSpecification Provenance Graph。うちの環境にはこれが無い。つまり効かせるゲートは持ってるのに、ルール↔チェック↔実行を横断で追跡する地図が無いんよな。だから「チェックはあるが何のルールに依拠してるか不明」みたいな断絶を、機械的には検知できない。統治は、止められるだけじゃ足りない。繋がりを追跡できて初めて完成するんじゃないか、と。とりあえず次に埋めるのはそこ。

日本語

2.3K

hiromi maeo@enhanced_jp·9h

Fable=戦略物資

Chubby♨️@kimmonismus

New update on Fable 5: and it's less about jailbreaks than anyone initially thought. Via Axios The Axios story that just dropped today reframes the whole thing: Anthropic hired a cybersecurity expert to review Amazon's findings and push back on the government's narrative. The administration viewed her as a "radical Democrat." She was then publicly celebrated by Chris Krebs, the official Trump just fired. That didn't help. Behind the scenes, officials describe a company that simply doesn't know how to talk to this administration. "It's like they just speak different languages," one source said. "Everybody said Anthropic was a bad actor. Some of us said it was time to give them a chance. Now those people are questioning that. They screwed us." Today: Anthropic staffers meet with Commerce, the CIA, and White House science advisor Michael Kratsios to work through compliance with the cyber executive order. The technical question - can Fable 5 be jailbroken - is almost secondary now. This is a story about a company that keeps losing the room. Ill keep you updated.

日本語

147

hiromi maeo@enhanced_jp·10h

@kgsi そう。だからもうデザイナーとは言えないかもw 何やってるかわからない人になってます。

日本語

こぎそ@kgsi·11h

@enhanced_jp わかる、AI触るのが楽しくってそっちばかりに目が行きがち問題

日本語

こぎそ@kgsi·12h

デザイナーにスコープ絞って、Claude MaxプランかChat GPT Proプランを契約してないと入れない勉強会イベントとかやったらどれぐらいきてくれるんだろ。濃ゆいイベントにはなると思うが母数がどの程度いるか気になる🤔 コレ読んで🖐️ってひと、リプ欲しい。

日本語

7.1K

hiromi maeo@enhanced_jp·10h

元論文 arxiv.org/pdf/2604.14228

日本語

hiromi maeo@enhanced_jp·10h

Claude Codeの98%はAIじゃない。この投稿に関して、面白そうだったのでarXivの元論文（arXiv:2604.14228）まで当たってみた。論文自体は実在するし、わりと真面目な工学比較研究。核が単純なwhileループで、コードの大半は周辺システム — 権限モードにML分類器、多段のコンテキスト圧縮、worktree隔離のサブエージェント。ここは本当。引っかかったのは投稿の結論のほう。「みんなが良いモデルを競ってる中、Anthropicだけが正反対にインフラの要塞を築いた」という部分。これ、要塞を築くのはAnthropicの逆張りじゃなくて、エージェント道具を作る全員の通り道であって、OpenAIのCodex CLIもGoogleのGemini CLIも、モデルも作りつつ決定論ソフトを分厚く被せてる。両方オープンソースだから開けば分かる。まったく同じ構造ってわけじゃないけど、同じ設計課題（権限・サンドボックス・サブエージェント・チェックポイント）に似た部品で答えてるはず。比べるなら道具は道具と — Claude Codeの隣に置くのはCodex CLIやGeminiCLIで、地続きの差はあっても「Anthropicだけが反対を向いた」事実はないんじゃないかな。 === もうひとつ、1.6%がAIって数字。これはコード量の話であって、価値の所在じゃない。数字だけで見るとインパクトあるけどね。正確には、AIの判断に関わるコードが推定1.6%ってことで、モデル呼び出しの行を数えた値じゃない。残りの98.4%は、その頭脳を暴走させずに使い切るための器 — 権限の番人、膨らむ文脈の圧縮、サブエージェントの隔離などなどに使われてる。だから、コードの割合が小さい=貢献が小さいわけじゃない。モデルが賢さの上限を決めて、周りの工学がその賢さをどれだけ落とさず引き出せるかを決める。だから賢いモデルを取りこぼさず引き出すためには工学が要る。これは自分でループを組んでて毎日実感してる部分。賢いモデルを置いただけじゃ、ブレーキがないから止まるべき所で止まらないし、文脈もすぐ溢れる。ハーネスを分厚くするのは、モデルの性能を諦めたからじゃなくて、その賢さを一滴も取りこぼさないためでもある。まあ、このあたりは次のフロンティアモデルでも生きてくるはず。Fable使ったときも思ったけど。しかし、Opus 4.8はたまにそれを超えるやらかしをするときもあるのはやや残念ではある。

How To Prompt@HowToPrompt__

Researchers show that Claude Code is 98% not AI. Anthropic never gave us the architecture for Claude Code. There were no docs. Just a tool that every developer is currently obsessing over. Until it leaked recently. A research team pulled the source code, analyzed all 500,000 lines, and found something ridiculous. Only 1.6% of the codebase actually interacts with the AI model. The core of Claude Code is literally just a simple while-loop. It asks the model what to do, runs a tool, and repeats. So what is the other 98.4%? It is hardcore, traditional software engineering. The researchers found a massive, complex infrastructure designed entirely to babysit the AI and keep it from hallucinating or destroying your computer: - A 7-mode permission system acting as a security bouncer. - A 5-layer context compaction pipeline so the AI doesn't forget its goal. - A subagent delegation mechanism with strict worktree isolation. - Four different extensibility hooks to manage external tools safely. Every startup right now is trying to build a better AI model to get better results. Anthropic did the exact opposite. They took an existing model and built a fortress of deterministic software around it. They realized that the AI doesn't need to be smarter. It needs to be managed.

日本語

2.5K

Открыть

@kgsi @kimotuki @kenn @RaminNasibov @kenichiota0711 @proves @elonmusk @BarackObama