ike | カウシェCTO

951 posts

ike | カウシェCTO banner
ike | カウシェCTO

ike | カウシェCTO

@ike002jp

日本のECを再発明する / カウシェ執行役員CTO ← DeNA ← 東工大(計算工学 ← 情報工学)。ソフトウェアエンジニア, Go, Ruby, Perl, Google Cloud, スノーボード, 釣り

Katılım Nisan 2011
1.3K Takip Edilen459 Takipçiler
Sabitlenmiş Tweet
ike | カウシェCTO
ike | カウシェCTO@ike002jp·
開発効率上げて事業成長スピード加速させるぞ!の振り返りを、アドベントカレンダー1日目として書きました! AIで開発効率2倍に挑戦中。プルリクエストやデプロイは60~150%増え、アウトカムへの寄与は? #カウシェアドベントカレンダー
ike | カウシェCTO tweet media
日本語
9
28
41
4.4K
ike | カウシェCTO retweetledi
Shinichi Takaŷanagi
Shinichi Takaŷanagi@_stakaya·
Anthropicより「長時間の自律コーディングで性能を伸ばすには、モデル単体よりハーネス設計が重要だ」との解説記事。設計段階では生成/評価役に分け、さらに開発段階では 計画/生成/評価役の3エージェント構成推し Harness design for long-running application development anthropic.com/engineering/ha… [ポイント] ・長文脈での失速や自己評価の甘さを、役割分担・評価基準・必要に応じたコンテキスト整理で補間 ・ 結果、単独実行より高品質なフルスタックアプリを数時間で自律生成することに成功 ・一方、コスト増とのトレードオフも大きい
日本語
0
14
166
11.4K
ike | カウシェCTO retweetledi
久保田 雅也@Coalis
AIの本質は“生産性革命”ではなく“意思決定の格差拡大” - AI導入量=競争優位は誤り エージェント数・トークン量・AIコード比率などは活動量であって成果ではない - ボトルネックは「実行」から「判断」へ AIで開発コスト・時間がほぼ消失。重要なのは何を作るか、何をやめるか、どの市場を選ぶか。すべて「意思決定の質」 - AIは能力を拡張するが、誤りも加速する 良い戦略のチームは加速し、悪い戦略のチームは混乱が増幅 - 勝敗は「どれだけAIを使ったか」ではなく「AIが判断力を高めているか」
Alfred Lin@Alfred_Lin

x.com/i/article/2036…

日本語
0
7
29
6.3K
ike | カウシェCTO retweetledi
今井翔太 / Shota Imai@えるエル
直近のOpenAIは、AnthropicやGoogleとの競争に対抗して過去最大レベルの改革を行っており、かなりすごい情報が出てきています。まぁ本気で今年のIPOを目指しているのでしょう。以下直近確認できたものとコメント ・Anthropicに対抗して、全方位戦略をやめて法人向けプロダクト開発に体制変更。元々OpenAIは「AGI開発企業」として言語も画像も動画も音声もSNSもブラウザも、なんなら長期的にはロボティクスもやる体制だったが、さすがにリソースが分散しすぎて、一番収益が稼げるポイントでAnthropicなどに性能面で勝てなくなっていたため、思い切った模様 ・動画生成 SNSのSora提供終了。動画生成は技術的にもかなり計算資源を食うこと、そもそも最初期を除きずっとユーザーが減っていたこと、動画生成機能提供による法的リスクが原因だろう。上記の全方位戦略からの転換による整理の一環。SNSはともかく、モデルの提供そのものをやめるかどうかまでは不明。ついでにSoraと紐づいていたディズニーとの契約も打ち切り(ディズニーのコメントを見る限り、そこまで派手に怒っている訳ではなさそう) ・Soraの研究の知見は今後世界モデル研究に活かす模様。ロボティクスへの応用を見込んでおり、この辺の方針はGoogleやNVIDIAなどと同じ。Anthropicは現状こちらの方面への取り組みはない。 ・安全対策・セキュリティチームを別のチームの下に移管する ・製品部門をAGI Deploymentに改名する。法人向けプロダクトに舵を切りつつ、看板は思い切ったものにして差別化を図っていそう ・次期フロンティアモデルのコードネーム「Spud」の事前学習が完了。GPT-5.5なのか、GPT-6なのかは不明だが、数週間以内に公開されると見込まれている ・
日本語
12
271
1.2K
168.1K
ike | カウシェCTO retweetledi
久保田 雅也@Coalis
AI時代のプロダクトは - API / CLIとして存在(Capable primitive) - エージェントが動的に呼び出す(Machine readable) - 他ツールと組み合わされる(Composable) 「使われる」から「呼び出される」へ
andrew chen@andrewchen

Web 1.0 came with new channels: - email, search, link sharing, etc Web 2.0 too: - feeds, creators, viral invites, etc Mobile: - app stores, SMS invites, vertical vid, mobile ads What about AI? I’ve been complaining that AI hasn’t come with much. But we’re seeing a big growth channel opening now: Products that are built as APIs/CLIs that can be pulled into new projects by Codex/Claude on the fly Maybe the “AI-native hotel app” doesn’t mean a mobile booking app with an AI chat panel. It means a CLI that can book a hotel for you, that an AI agent can pull into a bespoke answer or project or into code. Bolting on an AI chat panel is this generation’s weak form of AI. Maybe the full reinvention involves making it agent-first not human-first and once you start looking at it that way, a lot of existing products suddenly feel mis-specified. they’re built as destinations, but agents don’t want destinations. they want capabilities. composable, callable, reliable capabilities. So instead of “go to Expedia” or “open the app,” the future interaction is more like: an agent assembles a workflow on the fly. it pulls a flight search tool, a hotel booking tool, maybe a weather model, maybe even your personal preference graph. none of these are full products in the traditional sense. they’re more like endpoints with taste and state. This flips distribution completely. historically you win by owning the surface area. seo, app store ranking, homepage traffic. in an agent world, you win by being the default callable primitive. the thing that shows up again and again in agent-generated plans because it works, has clean interfaces, and returns structured outputs. distribution shifts from “top of funnel” to “top of call stack.” And the crazy part is this might actually compress product surface area dramatically. the best products might look more like tight, extremely well-designed CLIs with opinionated defaults rather than sprawling UIs. almost like the stripe api moment, but for everything. imagine if every vertical had a “stripe-level” primitive that agents preferentially use. there’s also a weird inversion of brand here. humans used to choose brands. now agents will. so the brand becomes partially machine-legible. reliability, latency, error rates, schema clarity. you can almost imagine “agent seo” where the ranking factors are things like success rate across thousands of agent runs, or how easy your tool is to integrate in a chain-of-thought execution loop. This also suggests a new kind of moat. not just data or network effects, but integration depth with agent ecosystems. if claude or codex or openclaw learns that your tool is the safest way to accomplish X, it gets baked into prompts, templates, maybe even fine-tunes. you become a default. and defaults, historically, are insanely sticky. The contrarian take is that most current “AI features” are a local maximum. chat panels, copilots, assistants. they’re transitional. the real end state might look closer to invisible infrastructure that agents orchestrate. the ui is just a debug layer for humans to peek into what the agents are doing. so maybe the new growth channels for ai look like: - being callable - being composable - being reliable at scale in agent loops - being embedded in agent templates and workflows - being the default primitive in a given domain and if that’s right, then the question for any new product isn’t “what’s the ui” or even “what’s the killer feature.” it’s “what’s the minimal, highest-leverage capability we can expose such that agents will repeatedly choose us when building something new.”

日本語
0
3
43
9.9K
ike | カウシェCTO retweetledi
andrew chen
andrew chen@andrewchen·
Web 1.0 came with new channels: - email, search, link sharing, etc Web 2.0 too: - feeds, creators, viral invites, etc Mobile: - app stores, SMS invites, vertical vid, mobile ads What about AI? I’ve been complaining that AI hasn’t come with much. But we’re seeing a big growth channel opening now: Products that are built as APIs/CLIs that can be pulled into new projects by Codex/Claude on the fly Maybe the “AI-native hotel app” doesn’t mean a mobile booking app with an AI chat panel. It means a CLI that can book a hotel for you, that an AI agent can pull into a bespoke answer or project or into code. Bolting on an AI chat panel is this generation’s weak form of AI. Maybe the full reinvention involves making it agent-first not human-first and once you start looking at it that way, a lot of existing products suddenly feel mis-specified. they’re built as destinations, but agents don’t want destinations. they want capabilities. composable, callable, reliable capabilities. So instead of “go to Expedia” or “open the app,” the future interaction is more like: an agent assembles a workflow on the fly. it pulls a flight search tool, a hotel booking tool, maybe a weather model, maybe even your personal preference graph. none of these are full products in the traditional sense. they’re more like endpoints with taste and state. This flips distribution completely. historically you win by owning the surface area. seo, app store ranking, homepage traffic. in an agent world, you win by being the default callable primitive. the thing that shows up again and again in agent-generated plans because it works, has clean interfaces, and returns structured outputs. distribution shifts from “top of funnel” to “top of call stack.” And the crazy part is this might actually compress product surface area dramatically. the best products might look more like tight, extremely well-designed CLIs with opinionated defaults rather than sprawling UIs. almost like the stripe api moment, but for everything. imagine if every vertical had a “stripe-level” primitive that agents preferentially use. there’s also a weird inversion of brand here. humans used to choose brands. now agents will. so the brand becomes partially machine-legible. reliability, latency, error rates, schema clarity. you can almost imagine “agent seo” where the ranking factors are things like success rate across thousands of agent runs, or how easy your tool is to integrate in a chain-of-thought execution loop. This also suggests a new kind of moat. not just data or network effects, but integration depth with agent ecosystems. if claude or codex or openclaw learns that your tool is the safest way to accomplish X, it gets baked into prompts, templates, maybe even fine-tunes. you become a default. and defaults, historically, are insanely sticky. The contrarian take is that most current “AI features” are a local maximum. chat panels, copilots, assistants. they’re transitional. the real end state might look closer to invisible infrastructure that agents orchestrate. the ui is just a debug layer for humans to peek into what the agents are doing. so maybe the new growth channels for ai look like: - being callable - being composable - being reliable at scale in agent loops - being embedded in agent templates and workflows - being the default primitive in a given domain and if that’s right, then the question for any new product isn’t “what’s the ui” or even “what’s the killer feature.” it’s “what’s the minimal, highest-leverage capability we can expose such that agents will repeatedly choose us when building something new.”
English
128
82
774
162.7K
ike | カウシェCTO
プログラミングを時間積分したのがソフトウェアエンジニアリング > ソフトウェアを書くことは芸術であり、本当に上達するには約10年かかる > ソフトウェアには「時間の経験」があります
Yoshiki Shibata/柴田芳樹@yoshiki_shibata

AIがコードを書く時代でも、エンジニアの熟達は早くならないのではないか|柴田 芳樹 @yoshiki_shibata note.com/yoshiki_shibat…

日本語
0
0
1
229
Kenta Takahashi | カウシェ
インタビューをしていただきました! ぜひとも一緒に働きましょう! > 「28歳で価値観が変わった」フリーランスから正社員へ転身したエンジニアの決断 note.com/kauche/n/nb90e…
日本語
9
14
30
3.7K
ike | カウシェCTO
ike | カウシェCTO@ike002jp·
> 「これをやるぞ」と決まった時の一体感や、お祭りのような雰囲気が好きで、技術好きな人が多く、プライベートでも技術の話題で盛り上がれる、知的好奇心の強い環境
Kenta Takahashi | カウシェ@kt_kauche

インタビューをしていただきました! ぜひとも一緒に働きましょう! > 「28歳で価値観が変わった」フリーランスから正社員へ転身したエンジニアの決断 note.com/kauche/n/nb90e…

日本語
0
0
4
439
ike | カウシェCTO retweetledi
Oikon
Oikon@oikon48·
Claude Code 2.1.75 (抜粋) ・Max、Team、Enterprise プランにおいて Opus 4.6 の 1M コンテキストウィンドウをデフォルトで有効化(以前は追加使用量が必要だった) ・`/color` コマンドを全ユーザーに開放: セッションのプロンプトバーの色を設定可能に ・`/rename` 使用時にプロンプトバーにセッション名を表示するように ・メモリファイルに最終更新タイムスタンプを追加: どのメモリが新しいか古いかをClaudeが判断しやすくなった ・Hooksが確認を必要とする場合のPermission PromptにHooksのソース(settings/plugin/skill)を表示するように ・新規インストール時に `/voice` を2回トグルしないと音声モードが正しくアクティブにならない問題を修正 ・`/model` または Option+P でモデルを切り替えた後に Claude Code ヘッダーの表示モデル名が更新されない問題を修正 ・Bashツールがパイプコマンド内の `!` を変換してしまう問題を修正(例: `jq 'select(.x != .y)'` が正しく動作するように) ・thinking および `tool_use` ブロックのトークン推定が過大計上される問題を修正: 早期のコンテキストコンパクションを防止 ・Config タブを訪問した後に Esc で `/status` ダイアログが閉じない問題を修正 ・Planを承認または拒否する際の入力処理を修正 ・Agent Teamsのフッターヒントが "↓ to expand" と表示される問題を修正: 正しい "shift + ↓ to expand" に変更 ・非同期フック完了メッセージをデフォルトで非表示に(`--verbose` またはトランスクリプトモードで表示可能)
Oikon tweet media
日本語
2
13
96
11.9K
ike | カウシェCTO retweetledi
後藤洋平|カウシェ
日経新聞に取り上げていただきました。 スタートアップへの転職、40歳以上は10年前の7倍以上に増えているそうです。 自分もその一人。 40代でスタートアップCFOになった理由はシンプルで、「まだ挑戦できる場所にいたかった」から。 カウシェでは未来の仲間を探しています。 挑戦したいと感じている方、ぜひ話しましょう。 (記事リンクはリプライに)
後藤洋平|カウシェ tweet media
日本語
8
14
41
9.9K
ike | カウシェCTO retweetledi
ike | カウシェCTO retweetledi
ike | カウシェCTO
ike | カウシェCTO@ike002jp·
翻訳コピペ: Claude Codeの新機能:コードレビュー。エージェントのチームがすべてのPRに対して徹底的なレビューを実行します。 私たちはまず自分たちのためにこれを構築しました。Anthropicのエンジニア1人あたりのコード出力が今年200%増加しましたが、レビューがボトルネックでした。 個人的には、数週間使っていますが、そうでなければ気づかなかった多くの実際のバグを検出してくれることがわかりました。
Boris Cherny@bcherny

New in Claude Code: Code Review. A team of agents runs a deep review on every PR. We built it for ourselves first. Code output per Anthropic engineer is up 200% this year and reviews were the bottleneck Personally, I’ve been using it for a few weeks and have found it catches many real bugs that I would not have noticed otherwise

日本語
1
0
4
797
ike | カウシェCTO retweetledi
AIDB
AIDB@ai_database·
LLMに個人やペルソナを演じさせる際に「内面から」模倣させる技術。 スタンフォード大学らの研究チームによると、心理学的な6つの軸に沿ってモデルを強化学習することで「その人らしい」「人間らしい」をこれまでにない精度で実現できたとのこと。 プロンプトで表面的に模倣させる手法から一歩踏み 込んだ取り組みです。 実験では、ニュースコメントから書籍レビュー、政治ブログ、メールまで6領域を網羅し、約2万6千人の実在ユーザーによる約21万6千件の応答を含む大規模なデータで検証したところ、この手法が最良という結果に。 研究者らは、これまでの心理学の知見から、人の内面は「信念・目標・感情・価値観・立場・コミュニケーション方式」でラベル付け可能であると考えました。 今回の手法は、この6軸に沿って、LLMに「このユーザーはこの文脈で何を思い、どう感じ、何を目指しているか」を推論させ、その推論結果をもとに強化学習を行うというもの。 111名によるリアルタイム実験でも最高の評価を受けています。
AIDB tweet media
日本語
16
326
1.9K
273.1K
ike | カウシェCTO
ike | カウシェCTO@ike002jp·
翻訳 --- 本日リリース:/loop /loop は、最大3日間、繰り返しタスクをスケジュールするための強力な新機能です 例:「/loop 私のすべてのPRをベビーシット。ビルド問題を自動修正し、コメントが入ったら、ワークツリーエージェントを使って修正する」 例:「/loop 毎朝、Slack MCP を使って、私がタグ付けされたトップ投稿のサマリーを私に送る」 ご意見をお聞かせください!
Boris Cherny@bcherny

Released today: /loop /loop is a powerful new way to schedule recurring tasks, for up to 3 days at a time eg. “/loop babysit all my PRs. Auto-fix build issues and when comments come in, use a worktree agent to fix them” eg. “/loop every morning use the Slack MCP to give me a summary of top posts I was tagged in” Let us know what you think!

日本語
0
0
3
457
ike | カウシェCTO retweetledi
goro | カウシェ
goro | カウシェ@56hino·
カウシェで働く理由について、インタビューしていただきました。 事業転換やフェーズの変化で大変なことも多い中で、 それでもカウシェでプロダクトを作り続けている理由を話しています。 もしよければ、読んでみてください👇 note.com/kauche/n/nabe8…
日本語
1
10
12
2.9K
ike | カウシェCTO retweetledi
久保田 雅也@Coalis
久保田 雅也@Coalis@kubotamas·
CursorのWar time宣言。Claude Codeが出た時、最初は競合に思えなかった。売上で抜かれ、解約も始まってる 現在、Anthropic/OpenAIへの依存を下げるため、独自モデル「Composer」を開発中と。変化が速すぎる forbes.com/sites/annatong…
日本語
5
38
239
44.6K
ike | カウシェCTO retweetledi
Oikon
Oikon@oikon48·
Claude Code 2.1.71 【新機能】 ・/loop コマンドを追加。プロンプトまたはスラッシュコマンドを定期的な間隔で繰り返し実行できる(例:/loop 5m check the deploy) ・セッション内で定期的なプロンプトを実行するためのcronスケジューリングツールを追加 ・voice:pushToTalk キーバインドを追加。音声起動キーを keybindings.json で変更可能に(デフォルト:space)— meta+k のようなmodifier+letter組み合わせはタイピングへの干渉がゼロ ・fmt、comm、cmp、numfmt、expr、test、printf、getconf、seq、tsort、pr をBash自動承認許可リストに追加 【修正】 ・キー入力が処理されなくなるがプロセスは生き続ける、長時間セッションでのstdinフリーズを修正 ・音声モードが有効なユーザーで発生していた5〜8秒の起動フリーズを修正。システムウェイク後にCoreAudioの初期化がメインスレッドをブロックすることが原因だった ・多数のclaude.aiプロキシコネクタが期限切れOAuth tokenを同時に更新する際の起動UIフリーズを修正 ・フォークされた会話(/fork)が同じプランファイルを共有し、一方のフォークでのプラン編集がもう一方を上書きしていた問題を修正 ・画像処理の失敗時にReadツールが過大なサイズの画像をコンテキストに追加し、画像の多いセッションで後続のターンが壊れる問題を修正 ・heredocのコミットメッセージを含む複合bashコマンドで誤った権限プロンプトが表示される問題を修正 ・複数のClaude Codeインスタンスを実行中にプラグインのインストールが失われる問題を修正 ・OAuth token更新後にclaude.aiコネクタが再接続できない問題を修正 ・以前に接続したものだけでなくorg設定の全コネクタに対してclaude.ai MCPコネクタの起動通知が表示される問題を修正 ・バックグラウンドエージェントの完了通知に出力ファイルパスが含まれず、コンテキスト圧縮後に親エージェントがエージェントの結果を回収しにくい問題を修正 ・コマンドが非ゼロステータスで終了する際のBashツールエラーメッセージが重複して出力される問題を修正 ・ローカルにChromeがないマシンで実行した後、Chrome拡張の自動検出が「not installed」のまま永久に固定される問題を修正 ・マーケットプレイスがブランチ/タグのrefにピン留めされている際に /plugin marketplace update がマージ競合で失敗する問題を修正 ・/plugin marketplace add owner/repo@ref で @ が正しく解析されない問題を修正。以前は # のみがrefの区切り文字として機能しており、strictKnownMarketplaces 使用時に診断困難なエラーが発生していた ・末尾スラッシュの有無で同じディレクトリが /permissions のWorkspaceタブに重複して表示される問題を修正 ・チームエージェントが設定されている場合に --print が永久にハングする問題を修正。終了ループが長時間稼働する in_process_teammate タスクを待ち続けなくなった ・ToolSearch を呼び出すたびにREPL内で「❯ Tool loaded.」が表示される問題を修正 ・モデルがmingwスタイルのパスを使用する際にWindowsで cd && git ... へのプロンプトが発生する問題を修正 【改善】 ・ネイティブ画像プロセッサの読み込みを初回使用時まで遅延させることで起動時間を改善 ・ラップトップのスリープ解除後のブリッジセッション再接続を改善。最大10分かかっていたものが数秒で完了するように ・/plugin uninstall を改善。プロジェクトスコープのプラグインを .claude/settings.json ではなく .claude/settings.local.json で無効化するようにし、チームメンバーに影響しないように ・プラグインが提供するMCPサーバーの重複除去を改善。手動設定済みのサーバーと重複するサーバー(同じコマンド/URL)はスキップされ、接続やツールセットの重複を防止。抑制されたものは /plugin メニューに表示される ・/debug をセッション途中でデバッグログのオン/オフを切り替えられるように更新(デバッグログはデフォルトで出力されなくなったため) 【削除】 ・未認証のorg登録済みclaude.aiコネクタの起動通知ノイズを削除
Oikon tweet media
日本語
4
31
250
47.9K