だみ〜 retuiteado
だみ〜
155.7K posts

だみ〜
@guiltydammy
量子力学と秋元真夏さんが好きなデータサイエンティスト。 インターネット上の発言はすべて個人のもので、何かを代表して言ってません。
外神田 Se unió Ekim 2010
5.4K Siguiendo5.3K Seguidores
だみ〜 retuiteado
だみ〜 retuiteado
だみ〜 retuiteado

Deepseek V4の想像をはるかに越える解決策
予想外の回答にかなり笑ってしまいましたが、すいません、Deepseekは本当に凄いと思っています。
どうも「ナイフ1本だけで」という条件を、必要不可欠な条件、義務として解釈してしまうケースがあるのではないかと言う説

Xiuyu Li@sheriyuo
DeepSeek V4 got beaten by SimpleQA? The real issue is the mismatch between high scores and actual capability. You can already see it from the base model’s score distribution: something feels off. When a model optimizes for metrics but not intelligence, this is what happens. Maybe it’s time for a rollback. Evil DeepSeek. (Image translated from Chinese by grok)
日本語
だみ〜 retuiteado

ドキュメントチームを解雇、某SaaSを解約、自分で月150万円のAIを溶かす。Treasure Data太田CEOが語る「無敵モード」の経営が異次元だった。トップクラスのソフトウェアCEOが今何を考え何をしているのか、学びが多かった!
1. ビルダーの時代が来て、今はスーパーマリオのスター状態。
ここ半年から9ヶ月でコードを書く機会が爆発的に増えており、プロダクト開発だけでなく、社内データの集約、顧客状況を調べるAI、コンバージョン率が下がった原因分析まで、あらゆるアイデアを自分で試せるようになった。これまで「作る」ことがボトルネックで、その先のディストリビューションにも壁があったが、その構造が崩れている。今この瞬間はスーパーマリオでスターを取ったような「無敵モード」である。
2.エンジニアリングバックグラウンドが先読みの武器になった。
太田氏は元々CTOからCEOになった経歴の持ち主で、半年から9ヶ月前の段階で「これは違う領域に入る」と先に判断できたのは技術的な素養があったからだと認めている。Claude Code、Manus、Genspark、Codex系など複数のコーディングエージェントを実際に回して比較しており、経営判断の前に自分の手で触って確かめる姿勢が、変化のスピードが速い時代における経営者の競争優位になっている。
3.ドキュメントチームを丸ごと解雇し、AIとPMとGitHubで置き換えた。
アメリカ本社では昨年3月時点で、ドキュメントサイトを書いていたチームが全員解雇された。以降はPRD(プロダクト要求ドキュメント)をインプットにAIが顧客向けドキュメントを生成する体制に移行。ファンクションやロールが消えたり増えたりという変化が現実として起こっており、「AIがソフトウェアを代替する」という抽象論ではなく、職能単位での入れ替えが実際に進行している。
4. AI時代はバンドリング有利、SaaS時代のベストオブブリードから逆転した。
SaaS時代はDropbox=ストレージだけ、というようにポイントソリューションをアンバンドリングする流れだったが、AIは複数機能がくっついている方が動きやすい。Treasure DataもCDP以外の周辺領域を食いに行っており、この構造変化はTreasure Data自身の製品戦略と、SaaS業界全体の今後を読む上での重要な補助線になっている。
5. 複数SaaSを一斉解約しHubSpot等へコンソリデーションし大幅コスト削減。
社内のセールス周辺ツール群を一掃してHubSpotに置換、人事・会計ではBambooHRなどからWorkdayの中小企業向けソリューションへ集約した。結果として数億円のコスト削減を実現している。意思決定は太田氏とCFOのトップダウンで横断的に実行されており、チームには「1年間毒を飲んで泣いてもらった」と表現するほど痛みを伴う移行だったが、ツールがバラバラだとワークフローもAIもバラバラになるという判断が優先された。
6. SaaSを自作せずHubSpotを選んだのはセキュリティと経済合理性の問題。
「SaaS is deadだから全部Vibe Codingで作ればいい」という意見もある中で、あえて外部SaaSを選んだ理由は、セキュリティ、マネジメントケーパビリティ、そしてメンテする人材のコスト。HubSpotを同社規模で使っても数千万円程度であり、ソフトウェアエンジニア3人雇うコストと比較すると圧倒的にHubSpotを使う方が合理的、と明言している。自作至上主義への冷静な反論として参考になる。
7. AIプロダクトはトークン従量課金+年間バケット購入のハイブリッド。
エンタープライズは月次スパイクを嫌うため、1年単位でトークン数(会話数)をバケットで前払い購入する仕組みを採用。月次目標値を設定し、1〜2ヶ月の連続超過は許容、3ヶ月目から追加課金が発生する構造にしている。Datadogに近いモデルで、予算の見えにくさへの実務的な答えになっている。AI製品の売上はすでに全社の約10%まで到達している。
8. AI売上のグロスマージンは8割より低いが、全体のNRRで回収する思想。
従来SaaSのグロスマージン8割が業界標準だったが、AI売上はトークン原価が直接乗るため下がる。ただしAIがアダプトされるとCDP本体の利用量、メール・SMS・モバイルプッシュの送信ボリュームも増えるため、単体のマージンではなく全体のユニットエコノミクスで見る戦略。投資家からも「AIアダプトしたアカウントのNRRは上がっているか」と聞かれるようになっており、評価基準が変わりつつある。データを持っているプレイヤーだからこそ取れる戦略で、トークンと周辺ワークフローだけの会社はきついと指摘している。
9. 競争のインターフェース戦略は「3つとも用意」が答え。
ChatGPT等からリモートMCP経由でTreasure Dataに話しかける世界観、パートナーのAIエージェントから呼び出される世界観、自社エージェントの独自インターフェースの世界観、この3つの選択肢がある中で、ソフトウェアを作るコストが下がった今、3つすべてを用意できるというのが太田氏の結論。Microsoft、Anthropic、OpenAIとインターフェース面で正面勝負するのは難しいと認めつつ、データが溜まれば手段は選ばないというフラットな戦略に落とし込んでいる。

日本語
だみ〜 retuiteado
だみ〜 retuiteado
だみ〜 retuiteado

🚨BREAKING: Hugging Face just open-sourced an AI intern that reads ML papers, trains models, and ships the final model for you.
It’s called ML Intern.
And this is not another AI coding demo that prints a broken PyTorch script and disappears.
You give it the goal.
It researches.
Writes code.
Runs experiments.
Uses Hugging Face datasets.
Launches jobs.
Pushes the final model.
All from your terminal.
`ml-intern "fine-tune llama on my dataset"`
That’s the entire command.
The crazy part is how deep this goes:
→ reads HF docs and research
→ searches papers and datasets
→ uses Hugging Face jobs
→ searches GitHub code
→ runs local and sandbox execution
→ streams every step back to you
→ asks approval before risky actions
→ keeps working for up to 300 iterations
This is the first open-source AI intern I’ve seen that feels built for actual ML work.
Not chat.
Execution.
4K stars already.
100% Open Source.
github.com/huggingface/ml…

English
だみ〜 retuiteado
だみ〜 retuiteado

とても興味深い分析。生産労働人口あたりのGDPは日本もその他の先進国も過去30年の推移は変わらない、という単純な計算。
30-40代の労働人口が多いと消費が大きい。家、車、保険という大型の支出が集中するため。また、30-40代が人口の中心だとリスクをとった経営、クリエイティブな文化が作られやすくなる。
日本は80-90年代。韓国は2000年代、中国は2010年代。アメリカは常に移民で平均年齢が30代。
人口動態から時代によって国を変えていくような生き方を考える事もできますね。
More Births@MoreBirths
An astonishing paper this week finds that population explains *virtually all* of the difference in GDP growth in advanced economies over the last 30 years! "From 1998 to 2019, Japan has grown slightly faster than the U.S. in terms of per working-age adult." 🧵, please share!
日本語

だみ〜 retuiteado
だみ〜 retuiteado

















