FI𝕊HΞRY Isla

1.5K posts

FI𝕊HΞRY Isla

@FINT1121

เข้าร่วม Ekim 2021

5.1K กำลังติดตาม2.2K ผู้ติดตาม

FI𝕊HΞRY Isla@FINT1121·21 Mar

@dontbesilent 和贾国龙一个认知水平。

中文

dontbesilent@dontbesilent·21 Mar

我觉得免费分享是个好事儿😄 持续迭代，持续开源

dontbesilent@dontbesilent

我的推文做成了 skill github.com/dontbesilent20… 一行安装 npx skills add dontbesilent2025/dbskill 这些框架从 12307 条推文中提炼而来，覆盖商业本体论、IP 与内容、思维与哲学、实操运营、AI 与工具、心理与执行等方向

中文

585

121.5K

FI𝕊HΞRY Isla รีทวีตแล้ว

Fuli Luo@_LuoFuli·19 Mar

MiMo-V2-Pro & Omni & TTS is out. Our first full-stack model family built truly for the Agent era. I call this a quiet ambush — not because we planned it, but because the shift from Chat to Agent paradigm happened so fast, even we barely believed it. Somewhere in between was a process that was thrilling, painful, and fascinating all at once. The 1T base model started training months ago. The original goal was long-context reasoning efficiency. Hybrid Attention carries real innovation, without overreaching — and it turns out to be exactly the right foundation for the Agent era. 1M context window. MTP inference for ultra-low latency and cost. These architectural decisions weren't trendy. They were a structural advantage we built before we needed it. What changed everything was experiencing a complex agentic scaffold — what I'd call orchestrated Context — for the first time. I was shocked on day one. I tried to convince the team to use it. That didn't work. So I gave a hard mandate: anyone on MiMo Team with fewer than 100 conversations tomorrow can quit. It worked. Once the team's imagination was ignited by what agentic systems could do, that imagination converted directly into research velocity. People ask why we move so fast. I saw it firsthand building DeepSeek R1. My honest summary: — Backbone and Infra research has long cycles. You need strategic conviction a year before it pays off. — Posttrain agility is a different muscle: product intuition driving evaluation, iteration cycles compressed, paradigm shifts caught early. — And the constant: curiosity, sharp technical instinct, decisive execution, full commitment — and something that's easy to underestimate: a genuine love for the world you're building for. We will open-source — when the models are stable enough to deserve it. From Beijing, very late, not quite awake.

English

346

626

2.4M

FI𝕊HΞRY Isla รีทวีตแล้ว

AB Kuai.Dong@_FORAB·15 Mar

连马斯克都认可。a16z 联合创始人，分享的信息获取方式。浏览 X 平台，听顶尖从业者分享，与最领先的 AI 模型对话，阅读旧的书籍。他认为做其他事情，付出的机会成本都太高了，其实只需要从这几个渠道，获取信息即可。

Marc Andreessen 🇺🇸@pmarca

My information consumption is now 1/4 X, 1/4 podcast interviews of the smartest practitioners, 1/4 talking to the leading AI models, and 1/4 reading old books. The opportunity cost of anything else is far too high, and rising daily.

Minato-ku, Tokyo 🇯🇵 中文

392

1.9K

304.1K

FI𝕊HΞRY Isla รีทวีตแล้ว

leifu _/@leifuchen·14 Mar

我印象中这是 X 上第一篇从实战角度系统讲解天气衍生品市场的文章，不过因为直接贴了 markdown 格式到 article，X 无法直接解析，导致阅读不便，需要大家自行把文章贴到支持 markdown 的阅览器细细品读。（用这个 article 提供的功能手工插入公式的的话，工作量可能比再写一篇还大 🤣） Y老师的原文是按照学术论文的框架写的，我把其中系统实现的部分单独提取了出来做成了笔记（链接见第一个回复），略去了大部分的推导，旨在帮助大家快速了解如何构建原文中的交易系统。（注：基于实时观测数据的交易中有两处核心实现原文有所保留，笔记中已标注待定项，需自行设计）大家可以结合笔记通读原文，了解各类参数的选取的缘由，知其然更知其所以然，最后再次感谢 Y 老师的无私分享 😀

Y林YourAirdrop.AI@YourAirdropETH

x.com/i/article/2032…

中文

175

26.4K

FI𝕊HΞRY Isla รีทวีตแล้ว

sitin@sitinme·13 Mar

最近有个方案叫 PinchTab。它换了一种思路：不再用截图，而是直接读取浏览器的 Accessibility Tree（无障碍树）。这个数据本来就是浏览器给视障用户准备的结构化信息，按钮、输入框、链接都会有明确的文本描述。AI 直接读这些结构化信息来操作页面，每页大约只需要 800 token，差不多能省 10～13 倍成本。更方便的是，安装几乎不用折腾。在 OpenClaw 里直接让 Agent 自动安装 PinchTab，再生成一个 skill，以后所有浏览器操作都可以走这个方案。比如打开网页、点击按钮、填写输入框、提取页面文本这些动作，Agent 都能自动完成。这个能力其实挺实用的，比如： ·批量分析 GitHub 项目 ·自动抓取网页信息做内容整理 ·定期监控某些页面变化 ·同时管理多个平台账号 PinchTab 还支持多浏览器实例并行，每个实例有独立 Cookie 和登录状态，比如一个跑 Twitter，一个跑 LinkedIn，互不干扰。一句话总结：如果你在用 OpenClaw 控制浏览器，换成 PinchTab 基本是必装插件。体积只有 12MB，但能让 Agent 用文本理解网页，既省 token，又更稳定。省下来的 token，一个月可能够你多跑好几个 Agent。

sitin@sitinme

x.com/i/article/2032…

中文

429

67.8K

FI𝕊HΞRY Isla รีทวีตแล้ว

车厘子@0xcherry·13 Mar

用 Typescript 重构了最流行的开源金融数据源工具 OpenBB，这下终于可以一键启动了。重构基本全程用 AI 跑，耗时两天，吃着火锅唱着歌就办完了。难免有疏漏，各位多提 issue。

车厘子@0xcherry

x.com/i/article/2032…

中文

142

29.5K

FI𝕊HΞRY Isla รีทวีตแล้ว

EconstratPB@EconstratPB·13 Mar

Folks. Happy Friday! Appreciate the engagement with these past 2 notes. Saying thank you by opening this one up and removing the paywall. Why? Bc I think it could help a lot of people develop their own trade strats for what’s coming up in 2026.

EconstratPB@EconstratPB

There is something bigger at risk from the Hormuz shock. A regime shift. Includes a roadmap and timeline to navigate this shift, and what to watch out for. As with Tuesday's note, most of it is free so have a read and pls like and RT if you found it useful. 🙏

English

117

67.4K

FI𝕊HΞRY Isla รีทวีตแล้ว

Andrej Karpathy@karpathy·8 Mar

The next step for autoresearch is that it has to be asynchronously massively collaborative for agents (think: SETI@home style). The goal is not to emulate a single PhD student, it's to emulate a research community of them. Current code synchronously grows a single thread of commits in a particular research direction. But the original repo is more of a seed, from which could sprout commits contributed by agents on all kinds of different research directions or for different compute platforms. Git(Hub) is *almost* but not really suited for this. It has a softly built in assumption of one "master" branch, which temporarily forks off into PRs just to merge back a bit later. I tried to prototype something super lightweight that could have a flavor of this, e.g. just a Discussion, written by my agent as a summary of its overnight run: github.com/karpathy/autor… Alternatively, a PR has the benefit of exact commits: github.com/karpathy/autor… but you'd never want to actually merge it... You'd just want to "adopt" and accumulate branches of commits. But even in this lightweight way, you could ask your agent to first read the Discussions/PRs using GitHub CLI for inspiration, and after its research is done, contribute a little "paper" of findings back. I'm not actually exactly sure what this should look like, but it's a big idea that is more general than just the autoresearch repo specifically. Agents can in principle easily juggle and collaborate on thousands of commits across arbitrary branch structures. Existing abstractions will accumulate stress as intelligence, attention and tenacity cease to be bottlenecks.

English

524

714

7.6K

1.1M

FI𝕊HΞRY Isla รีทวีตแล้ว

小鹏Digital@RocM301·27 Oca

OneBook-英文原著智能阅读伴侣首款支持epub3书籍真人朗读的外语学习app，非tss，完全真人配音（epub3书籍附在下方网盘链接）功能特点：文本随声音同步高亮，听和看同时进行，点击即可查词，AI释义，支持苹果播客油管B站视频解析，囊括了目前最热门的外语学习功能，支持多达50种语言，永久免费 epub3资源：pan.quark.cn/s/ead99f74b644

中文

376

62.7K

FI𝕊HΞRY Isla รีทวีตแล้ว

lidang 立党（全网劝人卖房、劝人学CS、劝人买SP500和NASDAQ100第一人）@lidangzzz·17 Oca

我已经大概将近10年完全没上过kaggle这个网站了。最早kaggle是一个data science打比赛网站，给你一大堆training dataset，让你在上面test dataset做prediction，大家一起排名。 kaggle优质的地方在于，上面的数据非常优质，覆盖范围极其广，缺点是你真的要在上面跑回归、提交数据。 pardus牛逼之处，在于我把kaggle上面任何一个csv下载下来，喂给pardus，不需要写任何一个字的prompt，pardus后面有>10个data scientist agent，并行给你工作，把csv读进去，给你跑regression。约等于你手底下有10个在kaggle上打比赛级别的北美top 50 DS master毕业的数据分析师，并行帮你处理数据、分析数据，最后帮你汇总成一份完整的报告。为什么no chatbot revolution是一个用户体验上的革命？因为你给我个csv文件，我他妈是真的连打开都懒得打开，打开了我连attribute都懒得看，绝大多数的老板和决策者都是这个心态。 pardus就是一个no chatbot data science multi agent，完全不用你写一个字，pardus自己帮你挖掘出十几个数据分析的任务，帮你讲故事，帮你用数据和图表来佐证。我可以说，我用了24小时的pardus，跑了10个巨大csv文件，里面有印度肝病的，有欧美血液检测的，有纽约房地产的，有全球电影票房的，有乳腺癌检测诊断的。 24小时之内，我唯一的工作就是找csv文件，然而我已经干了至少100个data science和bioinfo的活儿了。甚至乳腺癌的那份报告，直接当场给出了一套鉴别风险的金标准公式，直接套医学影像结果就可以当场诊断出来了。 pardusai.org/view/27c466adb… 最关键的是，我一句prompt没写，我唯一的活儿就是上传csv，等结果，读报告。我从来不敢说SWE Agent可以100%替代程序员，但我今天可以说，data science这个领域，算是彻底宣告死亡了。

lidang 立党（全网劝人卖房、劝人学CS、劝人买SP500和NASDAQ100第一人） tweet media

中文

195

171.5K

FI𝕊HΞRY Isla@FINT1121·16 Ara

@abskoop 不支持中文吧

日本語

272

ahhhhfs@abskoop·16 Ara

🔐 厌倦被“记录”的输入法？试试这款真正本地处理的输入法：Urik ✨滑行输入 + 拼写检查 + 智能纠错，还能把学习词库加密保存 🔐 不联网、不追踪、Gboard 的开源替代 👉ahhhhfs.com/78393/ #隐私优先 #开源输入法

中文

24.3K

FI𝕊HΞRY Isla รีทวีตแล้ว

Pie Man@Pememoni·5 Ara

Anyone who thinks privacy teams are "competitors" is missing the entire point. Privacy isn't a zero-sum game. It demands massive education, real cryptography, strong infra, and regulatory clarity. The real competition is people trying to brand Coinbase as their "privacy" solution, or the distracting parade of shared-sequencers and AI-GF scams pretending to solve anything. Privacy loves honest company. It's the reason blockchains matter at all; without it, centralized systems will always win on UX and cost. When one real privacy project wins, every honest privacy team wins, and the entire decentralized ecosystem becomes stronger. But that doesn't mean we should ignore teams jumping on the "privacy" label for attention or launching a token with zero substance. That kind of grift hurts everyone and sets the whole space back within months. Kudos to all privacy/confidentiality teams that are building for the long game @Zcash @0xfairblock @aztecnetwork @0xbowio @Arcium @RAILGUN_Project @PhalaNetwork @nym @signalapp and others!

English

196

9.5K

FI𝕊HΞRY Isla รีทวีตแล้ว

Lacie@Laaaaacieee·4 Ara

Hashkey招股书中的疑点：拒绝重估价并可提前确认为收入的平台币 $HSK 冲刺港交所上市的hashkey已在这周披露招股书，金融再就业的苯人对其平台币 $HSK 的会计处理非常好奇，研究后发现 $HSK 大有妙用，派发后先记成合同负债、不按市价重估，价格波动不影响负债表；此外还可以通过设定“预期非使用率”，将其提前确认为收入，从而达到美化财报的效果。 Hashkey对自家平台币的定义很明确，简单说就是“发币即负债，核销才确收”。（这里类似央行，发行的货币是负债） $HSK = 服务券，派发给kol/vip用户等的 $HSK 相当于欠其未来的服务。所以在财务上，发币当下计入 “合同负债”，相当于履约义务。这导致一个有趣的现象，币发得越多，账面负债越高。不过这部分的币价波动“隐身”，负债端的HSK不按市价重估，即无论 $HSK 跌，负债表不受影响。从负债确认为收入有2个方式： 1是当用户把 $HSK 花掉（抵扣交易手续费、用于hashkeychain gas等），平台完成履约义务了，负债就可转为收入。从披露的数字看, $HSK 过往的真实使用率( $HSK 手续费收入/派发的 $HSK 价值）不足2%，也足以见得其业务的惨淡...同时因为公司是亏损的，净利润为负，答应的20%净利润回购 $HSK 自然也就无法达成。 2便是美化财报的重头戏，即设定 $HSK “预期非使用率”，便可将这部分提前确认为收入：既然都没有人用，按照 IFRS15会计准则breakage的逻辑，履约义务视为取消，收入可以入账。招股书中说“就估计非使用权利所采用的预期使用率为5%”非常绕口，翻译成人话就是预期不会被使用的 $HSK 占比为1-5%=95%，即派发出去的 $HSK 中有95%均可被提前确认为收入。此外，招股书（附录I-7）将数字资产分为三类：无形资产、公允价值计入损益资产、存货。这里面的疑点在于，招股书全篇未披露这几亿数字资产的具体构成，有多少是真金白银的 BTC/ETH？又有多少是回收后/尚未派发的平台币 $HSK ？这也是一个完全的黑盒。所以如果你是hashkey，你还会选择去拉币价么？

中文

133

27.7K

FI𝕊HΞRY Isla รีทวีตแล้ว

A股证券交易员@ANDREW_FDWT·5 Ara

现在大家都开始研究这个文件了whitehouse.gov/wp-content/upl…

中文

290

176.2K

FI𝕊HΞRY Isla รีทวีตแล้ว

Zhixiong Pan@nake13·3 Ara

昨天公开的 Lux，应该是近期最有趣的一个 AI 模型了。它拓宽了 AI 能力的边界：能够像人一样直接操作电脑，这让许多原本受限的场景一下子变得现实起来。其实，OpenAI 和 Google 都有类似的模型，业内通常称之为 Computer-Using Agent（CUA），字面意思就是能自主操作电脑的智能体。这些模型的基本原理是：每次操作前截取屏幕快照，再由 LLM 判断下一步具体点击的位置，这样就能一步步串起完整的工作流。但 Lux 最厉害之处在于，它能将这种工作流的运行成本降到其他模型的十分之一，这就直接从量变推动到了质变。目前官方已对开发者开放 SDK，并提供了 10 美元的免费额度。或许接下来，我们能用它开发出一些更实用、更贴近用户日常体验的智能体应用了。

OpenAGI Labs@agiopen_org

Website: agiopen.org SDK: developer.agiopen.org Blog post: agiopen.org/blog The number of use cases is endless: software QA agents, e-commerce agents, social media management agents, data entry, bulk operations, etc. You can build whatever you want!

中文

7.6K

FI𝕊HΞRY Isla รีทวีตแล้ว

Feng Liu@fishkiller·2 Ara

Kalshi 以 110 亿美元融资 10 亿美元。原来这轮 Paradigm 领投。

John Wang@j0hnwang

Kalshi is officially the first prediction market decacorn. I still cannot believe how much we have grown (600%!) since I joined just 4 mo ago. This round was led by Paradigm and I’m very grateful for all the help @matthuang @_charlienoyes and @arjunblj have given to us so far

中文

9.6K

FI𝕊HΞRY Isla รีทวีตแล้ว

rick awsb ($people, $people)@rickawsb·1 Ara

中推上最全面的ai半导体年度总结和明年预测没有之一！

fin@fi56622380

回顾2025年半导体市场，真的是有太多太多精彩的故事，最大的主题就是: AI需求驱动导致半导体基建的估值体系重构 + 产业链的价值分配重写从2024年开始，半导体基建正在飞速吞噬整个IT产业利润，SP500里半导体净利润EPS在IT行业里占比，在两年时间从不到20%上升了到了40%，而且还在呈加速上升姿态半导体整体前瞻利润率从2023年的25%已经升到了2025年11月的43%，已经明显超过了几个互联网巨头的平均利润率，这也印证了半导体利润率超过互联网会是新常态。整个IT产业的利润分配，流向半导体的比例越来越大。要知道，就算是20~22年的半导体芯片荒，短缺如此严重，半导体的利润率和整个IT利润分配也没有显著增长这就是故事的上半篇：AI需求驱动导致半导体基建的估值体系重构，不再是互联网时期的基建从属地位 ------------------------ 这个现象背后的逻辑是商业模式随着技术特性的变迁：互联网时代，每次请求的网络和算力成本，边际成本极低，scaling的效果极好，分发的边际成本几乎为零在AI时代，这个互联网时代分发边际成本几乎为零利于scalable的特性遭遇了根本性的重大挑战：且不说训练成本从此不是一次性开销而是年年增长，就客户的AI推理请求而言，由于inference scaling成为共识，加上垂直领域仍然需要更大规模的旗舰模型来保持竞争力，推理的成本不会随着硬件算力价格的通缩而同步降低互联网企业从前的最大成本只有OPEX尤其是SDE人工成本，而现在，互联网公司历史上第一次像半导体厂foundry那样背上高折旧成本的资产负债表，商业模型恨不得要慢慢从“流量 × 转化率”部分转向“每 token 毛利”了简单的说，互联网时代到AI时代的成本分布，在人力成本opex的基础上又加上了沉重的硬件/算力成本capex(财报里占比：MSFT 33%, Meta 38%)。上个时代的互联网公司+CSP+SAAS是收租行业里的大赢家，而AI时代，算力(半导体/芯片折旧)成为了新的收租行业，整个IT行业的利润分布发生了剧烈的重新分配(EPS利润流向半导体从20%升到40%而且持续攀升中)，这就是半导体基建估值体系重构最重要的原因 --------------- 半导体高利润率的新常态趋势能持续多久？目前的高溢价来自于前期不计成本的军备竞赛造成的半导体订单积压过多但很显然，hyperscalers都不愿意当冤大头，都在试图自建ASIC降低成本，那么可以从2030年远期的算力分布来回看这个问题长线来看，openai已经明牌了标准答案，10GW Nvidia，10GW ASIC，6GW AMD，其他hyperscaler划分比例有类似考虑比如说，推理端希望ASIC >50%，GPU里再细分的话，AMD和NV(legacy)对半分。训练还是得NV占大头，60%+,剩下的自研ASIC和AMD对半分 2030年按60%推理，40%训练比例划分，算下来NV 38%， ASIC 39%， AMD 23%，跟openAI比例是几乎完全一致的，算是一个标准答案参考值当然了，微软，Amazon，Google，Anthropic这几家里AMD的比例会比这个标准答案中枢/参考值明显低一些，xAI则是没有ASIC只有Nvidia+少量AMD AMD的风险在于，当2030年再往后的更长期，CSP的in house ASIC越来越成熟(微软除外)，推理端ASIC占比可能越来越高，很难有incentive新买入大量GPU了，除非卖的足够便宜最近风头正劲的TPU呢？Meta是不是要转向TPU？对Nvidia的利润率影响大吗？实际上，Meta今年capex72B，明年capex110B，未来六年capex平均值可能达到160B附近，而Meta 6年10B的TPU订单算下来年均只有1.6B，而且购买的是TPU云服务，并不是裸TPU 也就是说，Meta这笔TPU订单只占到Meta未来6年capex的1%，并没有严肃的考虑大规模部署，可能只是作为和Nvidia讨价还价的手段而已另外从Meta最近几个月的招聘广告来看，也并没有看到任何TPU engineer方面的招聘，不像 Anthropic那样从五月就招一堆TPU kernel engineer，十月才宣布大规模采购TPU做训练所以说，不管原因是diversify供货商，还是给自研ASIC延迟做退路，还是因为AMD的MI350X延迟，Meta买TPU基本上只有一个考虑：增加买Nvidia GPU的议价权，但顶多只有推理份额里能讨价还价，实际效果很有限，对Nvidia利润率影响也很有限。要知道，22年加密货币熊市矿难的时候，NVDA库存上升到了198天，利润率只是从65%回撤到了56%，算上PE/宏观双杀股价才从300变100，现在一直供不应求，利润率没道理能降下来再加上TPU v8设计过于保守(没用HBM4)，Kyber rack的Rubin方案会比TPU v8的TCO更好，到头来最后还是得继续依赖Nvidia，很难议价。只要Nvidia继续保持这样的大踏步前进，竞争对手其实要跟上还是不容易的。总之，一方面，全产业链瓶颈，比如cowos扩张都很谨慎，供不应求的状态还能持续多年。另一方面，AI变现的利润曲线和硬件投入曲线存在“时间错配”，应用端的增长曲线会落后几年，只要这个应用端和基建端的增长曲线的时间错位依旧存在，半导体在IT行业的利润分配就会一直占优势。从OpenAI的到2030年的投入曲线来看，这个时间错位至少要持续到2030年附近。也就是说半导体行业的超级扩张期带来的在IT产业利润划分的主导地位，目前看至少能持续到2030年而半导体高利润率可能会维持的更长远一些，因为从互联网时代一次性基建属性变成了现在的收租基建属性 --------------------------------------------------- AI 不是只养活了 GPU，而是在用算力预算把“能把电变成 token 的每一环”都抬了一轮，从内存，存储，互联，光纤，电力，储能…..等等上半篇讲完了“半导体吞噬IT利润”，那么下半篇讲的就是“AI算力价值溢出效应（Spillover Effect）重塑半导体内部格局”：GPU算力增长 -> 内存/存储/互联/CPU瓶颈 -> 溢出效应 -> 结构性机会 2025 年更有趣的故事，是巨大的行业红利在半导体内部怎么诞生结构性新机会，比如说，一个super cluster需要几个数据中心互联，光纤互联的长度需要上百万mile这个级别，这就是新机会半导体产业链的结构性趋势带来的新机会，最典型的例子就是内存(DRAM/HBM)和存储(SSD)，HBM的需求增长太夸张，连带挤压DDR4/5产能，直接让以周期性为标志的内存行业甚至喊出了“周期不存在”了，Hynix因为在HBM上领先，甚至都开始憧憬起了几年后年利润1000亿美元，妥妥一个万亿市值的公司这两个板块背后，是结构性趋势的转变：AI workload从训练逐渐往推理延申，推理比例越来越大。而推理是一个非常纯粹的吃内存带宽速度(memory bound)的事情，可以说带宽速度=token/s。模型尺寸越来越大，以及上下文context length的增加，对内存的尺寸要求也相应增大，导致了内存的需求激增：推理即内存下一代的的GPU/ASIC内存已经成了暴力美学，配备的内存size之巨大，是三年前无法想象的，回看22年H100的80GB简直像个玩具，这才几年就增长了十倍： Nvidia Ultra Rubin - 1024GB HBM Qualcomm AI200 - 768GB LPDDR AMD MI400x - 432GB HBM 内存的另外一个潜在的爆发点在端侧，也就是手机/PC/汽车/机器人的端侧LLM，这两年主流的手机旗舰机已经从6GB升级到了8GB/12GB/16GB，提前为可能的端侧LLM生态做准备，毕竟手机算力下一代就能达到150TOPS量级，妥妥的桌面级，非常暴力潜力上来说，端侧内存升级是比云端内存增量要更大的市场，毕竟端侧终端device的数量太惊人了，每年都是billion级别，一旦端侧LLM生态繁荣起来，内存用量翻倍轻而易举，针对端侧低功耗内存/存算一体的各种设计都会跟上但端侧genAI的软件生态，似乎明显滞后，一直比我想象的进度要慢，可能是因为这方面还处于摸索期，并没有云端那么确定的ROI，厂商们在投入上都很谨慎，我在23~24年时候看好27年，可能还是太乐观了互联网->移动互联网用了10~15年，端侧genAI/LLM可能也需要7~10年，可能得等云端ROI开发的差不多了，边际收益下降了，才能轮得到端侧genAI/LLM拿到开发资源，跑通端侧ROI。 -------------------------------------- 另一个2025年半导体内部结构性转变的故事是NAND存储，特别是企业级eSSD硬盘结构性趋势来源也是同一个，AI workload的推理需求越来越大。内存红利也外溢到了SSD存储，甚至HDD存储，因为内存不够用就用高速SSD作为多级缓存主要逻辑是AI推理过程中内存溢出KV cache offloading到下一层SSD存储，以及向量数据库检索/indexing，都在增加SSD存储的需求 Micron财报说的精准又直白：“AI inference use cases such as KV cache tiering and vector database search and indexing, are driving demand for performance storage.” 至于为什么存储价格在第四季度才爆发，这需要区分一下合约价格和现货价格，合约价格涨幅会温和一些，就算是最紧缺的企业级eSSD合约Q4上涨大概25%。而当NAND产能在2025年被合约慢慢的吃光，现货的价格就造成了观感上强烈的冲击，一个月上涨50%以上。另一个未经验证的逻辑是多模态的爆发，特别是AI图片和AI视频的需求爆发，也会加剧存储的短缺，我觉得这条线只能说未来可期，但目前的视频/图片精细程度，可能还不到当年GPT3的水平，要达到出圈效果还需要一些时日。 ------------------------ 那么下一步还有什么趋势转移带来的半导体结构性的机会呢那么就要先看下一步AI推理端的需求趋势是什么，毫无疑问，agentic flow的比例会越来越大，2025并不是year of agent，而是一个decade of agent 从CPU视角去看agentic workload，routing和工具处理都在CPU上，如果把常用的agentic框架做profiling，比如SWE-Agent, LangChain, Toolformer，CPU最长可以占到90%的E2E端到端延迟，throughput瓶颈也更多的卡在CPU，甚至CPU能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情，在 agentic 框架里，CPU 是永远在忙的总指挥orchestrator, 很可能会成就CPU需求的新一波回暖 AMD 2025年Q2财报（8月5日），Lisa Su明确表述了这一现象："In particular, adoption of agentic AI is creating additional demand for general-purpose compute infrastructure, as customers quickly realize that each token generated by a GPU triggers multiple CPU-intensive tasks." "agent AI的采用正在对通用计算基础架构产生额外的需求，因为客户很快就意识到GPU产生的每个令牌都会触发多个CPU密集型任务。" Q3 财报里Lisa又明牌了一次CPU TAM increasing due to Gen AI. "Many customers are now planning substantially larger CPU build outs over the coming quarters to support increased demands from AI, serving as a powerful new catalyst for our server business." Nvidia也是把agent flow视为CPU需求，GB200/300 架构配置的CPU比例也比以往大的多，36颗 Grace CPU : 72颗 Blackwell GPU，直接达到了1：2的水平，AMD的路线则是用1~4个256核的EPYC去服务MI400系列72~128个GPU 以后的硬件架构，一定会往优化agent workload方向发展，比如agent task graph的调度和load balancing，CPU/GPU协同micro-batching 算力上的比较，说不定以后也会摆脱现在的纯GPU token rate比较，转向整个系统级全栈agentic benchmark比较. -------------------------- 半导体结构性转变带来的机会同时，下一步，可能也会带来一些意想不到的次生效应云端AI数据中心需求爆发，造成内存和存储的暴涨，给消费电子的成本带来了很大压力，在2026年，这也许会演变成消费电子产业潜在的黑天鹅 PC厂商最近的股票大跌，也是这个原因。HP已经说了要减少内存配置，暗示要把PC重回8GB内存+256GB存储的时代了。 DRAM内存和存储再这么涨下去，可能会出现很离谱的情况：内存/存储现货价格比CPU和GPU还要更贵。尴尬的是，这可能直接延缓了消费电子期望的AI PC的进程，毕竟大内存是更有利AI PC的表现力的。夸张的说，每个PC厂商和手机厂商的员工，甚至是消费电子厂商的员工，都应该买入存储和内存，作为职业风险对冲明年年初开始，安卓阵营的内存以及存储成本要压不住了，三星，小米的手机售价都提高的话(美国市场现在已经提高不少了)，利好最大的就是苹果苹果的内存产能，nand产能都是专属长约锁价特供的，顺带还把Kioxia给坑了好多不涨价产能，导致苹果的成本优势进一步扩大，苹果全球手机销量市占率增长可能会非常可观，接下来一阵子可能会是iphone辉煌的时光。 ----------------------- 2025年半导体市场真的是太多精彩的故事了，Nvidia/AMD/TPU和各家hyperscaler的恩怨情仇引得各路下注的吃瓜群众心情跌宕起伏。 HBM/内存厂商吃到了memory-bound的红利，NAND厂商意外收获了KV cache的溢出效应，CPU在沉寂近十年后，可能会因agent orchestration再次回到增长叙事的中心不再是Nvidia/AVGO几家算力厂商独大，而是AI workload算力价值溢出后的每一次演进，从训练到推理，从文本到多模态，从单模型调用到agentic flow，都在重写产业链的价值分配。云端AI的繁荣正在挤压消费电子的生存空间——当PC厂商被迫讨论重回8GB时代，苹果却因供应链优势坐收渔利。这场算力军备竞赛的次生效应，可能在2026年以意想不到的方式重塑整个消费电子格局半导体的故事不再是一条单线，而是一张持续自我重构的网。而 2025 年，大概只是合纵连横的第一回合

中文

114

53.7K

FI𝕊HΞRY Isla รีทวีตแล้ว

Zhixiong Pan@nake13·27 Kas

没想到 Vitalik 在短短 24 小时内，连续推荐了三个主打私密性的聊天工具： @session_app 、 @SimpleXChat 和 @ethstatus 。这一举动似乎又将进一步加剧即时通讯（IM）市场的碎片化问题。我之前还开玩笑地说，聊天工具是现代的「巴别塔」：虽然不同语言的问题已能通过 LLM 解决，但工具本身的割裂和封闭却始终难以跨越。目前，微信、Telegram、WhatsApp、Line 和 iMessage 已经牢牢占据了全球普通用户的聊天应用心智。除此之外，最多也只是 Signal 这种主打极致隐私保护的，能在市场上分一杯羹。然而，Vitalik 希望更进一步，在 Signal 已有的高标准之上，实现两个额外的突破： - 不需要手机号/邮箱即可自由创建账户，真正做到无需许可。 - 对通讯过程中产生的元数据（metadata）提供更强的隐私保护。我自己也一直希望能出现一款开源、重视隐私、功能强大且用户体验优秀的 IM 产品。这也是为什么早在 2017 年，我就抱着同样的期望参与了 Status 的 ICO。但现实很残酷：Status 在正式推出后曾短暂风光一时，但最终还是因为缺乏网络效应、使用门槛高，逐渐淡出了主流视野。但无论如何，先试试看这些产品吧，希望总有一款能形成足够的网络效应。

vitalik.eth@VitalikButerin

Encrypted messaging, like @signalapp, is critical for preserving our digital privacy. Two important next steps for the space are (i) permissionless account creation and (ii) metadata privacy. @session_app and @SimpleXChat are two messaging apps pushing these directions forward. For this reason I've donated 128 ETH to each. Addresses available on their websites if you wish to follow on: getsession.org simplex.chat But also, actually download and use them! Neither of the two are perfect pieces of software, they have a way to go to get to truly optimal user experience and security. Strong metadata privacy requires decentralization, decentralization is hard, users expecting multi-device support makes everything harder. Sybil / DoS resistance, both in the message routing network and on the user side (without forcing phone number dependence) adds further difficulty. These problems need more eyes on them. I wish all teams working on these important problems best of luck.

中文

147

43.5K

FI𝕊HΞRY Isla รีทวีตแล้ว

vitalik.eth@VitalikButerin·27 Kas

English

800

1.1K

5.9K

935.3K

FI𝕊HΞRY Isla รีทวีตแล้ว

Lao Bai@Wuhuoqiu·27 Kas

说下Zcash，因为上周看到这条Tweet，当时有事儿没转，正好这几天稍稍看了下Zcash的一些东西，把这事儿给拾起来简单说来就是欧美这个大V觉得这次Zcash就是以纳瓦尔为代表的一帮精英Cabal攢了个局，然后还找了一帮欧美顶流加密大V帮他们一起喊，亚洲KOL貌似就没几个收到这个广子…… 不过去看了下Zcash的Dashboard，确实隐私池Zec数量从今年初就迅速攀升，不是俩月前喊单了才有的 Sprout，Sapling是一二代池，用了ZK-Snark，绿的那个Orchard是三代Halo2的新技术隐私池，从图上看这一年数量在飙升不过11月之后不涨了，进入平台期，Zcash的币价可以看到11月摸了三次700左右的顶，似乎上升动能也有所停滞，跟隐私池的曲线基本保持一致至于还有人讨论的ZSA（Zcash Shielded Asset），把Zcash变成一个可以发行其他资产且享受Zcash隐私级别的平台，貌似是22年就有的提案，今年可算见到一些曙光。但是看进度一杆子支到明年Q4了，到时候Zcash热度还剩多少真不好说。再者这样一来Zcash不就变成一个类似Aleo，Oasis，Secret这种的“隐私智能合约公链”了？这不一定是好事儿，丢了Meme/SOV属性强行变身“功能链”，有可能像BTC非要尝试着走闪电网络搞支付最后还是回到SOV路线一样 - 此路不通！当然也可能是偏见，毕竟还没仔细去看社区的提案和讨论啥的。未来两周抽空仔细研究研究，届时再来跟大家分享

Mark Moss@1MarkMoss

Wonder why ZCash is showing up EVERYwhere all of a sudden? 👇

中文

33.2K

ค้นพบ

@dontbesilent @abskoop @Zcash @0xfairblock @aztecnetwork @0xbowio @Arcium @RAILGUN_Project