Tyrande

355 posts

Tyrande banner
Tyrande

Tyrande

@tyrandeB

crypto amateur

US Se unió Nisan 2022
495 Siguiendo146 Seguidores
Tyrande retuiteado
paulwei
paulwei@coolish·
同时观察美股5000多支股票,能看到什么? 昨晚做了个所有美股板块轮动趋势的可视化面板: fomo5000.com 作为一可视化观察学习市场的的新视角来抛砖引玉。 如果把股票的不同板块,比喻成人的五脏六腑, 这有点像用医学放射科CT扫描, 像观察肿瘤发展转移动态一样,去可视化看市场变化。 代码开源:github.com/bwjoke/fomo500… 视频介绍⬇️
paulwei@coolish

@villiva 美股总共5000多只股票,其中纳斯达克3000多只。 昨天我在想是否能做一个,把这几千只股票在同一张画布上进行一种巧妙的极简可视化,来鸟瞰观察轮动现象以及你做的这种泡沫阶段演化的。

中文
136
178
901
183.7K
Tyrande retuiteado
Herman Jin
Herman Jin@ShanghaoJin·
It is the best of times, it is the worst of times 宏观从没有那么严重过的石油危机,目前增长、通胀、需求影响还远远没发生 但几代人来,也没经历过那么强的产业革命。不同于00年,这是第一次将半导体技术进步直接变成生产力 过去是半导体—电子设备—软件—生产力 现在是半导体—AI模型token=生产力 可投资的范围正变得越来越窄,大部分fund其实今年都还在亏钱。而以后可能变更窄
中文
21
33
294
42.9K
Tyrande retuiteado
宝玉
宝玉@dotey·
转译:深度拆解 Hermes Agent 的记忆系统:它如何修正 OpenClaw 的误区 如果你读过我之前关于 ChatGPT、Claude 以及 Clawdbot 记忆系统的文章,你就会知道我一直在钻研同一个问题:这些 AI 智能体(AI Agent)到底是怎么记事的? Hermes Agent 对我来说格外有趣,因为这次我不需要只靠观察它的行为来搞“逆向工程”。Hermes 是开源的,它的代码库和文档都是公开的。所以,我没有通过提示词(Prompt)去盲测这个黑盒,而是直接翻看了它的代码路径——从它如何构建提示词状态、持久化会话,到如何清理记忆和查询历史对话。 简而言之:Hermes 拥有的不是一套记忆系统,而是四套。 1. 存储在 MEMORY.md 和 USER.md 中、经过高度浓缩的提示词记忆。 2. 通过 session_search 调用的 SQLite 历史会话存档(可搜索)。 3. 像程序记忆(Procedural Memory)一样运作的智能体技能管理。 4. 可选的 Honcho 层,用于更深层的用户建模(User Modeling)。 把这些设计联系在一起的核心逻辑非常简单:保持提示词稳定以便利用缓存(Caching),其他一切繁杂信息都交给工具。 让我们深入聊聊。 Hermes 的上下文结构 在理解记忆之前,我们先看看 Hermes 到底给模型发送了什么。 系统提示词(System Prompt)大致是按以下顺序组装的: ------- [0] 默认智能体身份 [1] 工具使用行为指南 [2] Honcho 集成模块(可选) [3] 可选系统消息 [4] 固化的 MEMORY.md 快照 [5] 固化的 USER.md 快照 [6] 技能索引 [7] 上下文文件(AGENTS.md, SOUL.md 等规则文件) [8] 日期/时间 + 平台信息 [9] 对话历史 [10] 当前用户消息 -------- 这非常关键,因为 Hermes 正在针对大模型供应商的提示词缓存(Prompt Caching)机制进行优化。代码显示,提示词构建器的目标非常明确:让稳定的前缀部分尽可能长时间地保持不变。 这一个决定就解释了 Hermes 大部分的记忆架构。 如果某条信息每一轮对话都要用到,Hermes 会尽量把它缩得很小并注入进去;如果信息量很大、属于历史旧账或者偶尔才有用,Hermes 就会把它踢出提示词,改用“按需检索”的方式。 第一层:固化的提示词记忆 其内置的记忆系统小得令人惊讶。 Hermes 将持久记忆存储在 ~/.hermes/memories/ 下的两个文件中: 1). MEMORY.md 智能体笔记:环境、规范、工具怪癖、教训 限制:2,200 字符 2). USER.md 用户画像:偏好、沟通风格、身份信息 限制:1,375 字符 这容量真不大。加起来大约只有 1,300 个 Token(模型理解文本的最小单位)。 而这正是刻意为之。 在会话开始时,Hermes 加载这两个文件,把它们渲染进提示词区块,然后在整个会话期间固化这个快照。会话中途写入的记忆会立即存入硬盘,但不会改变已经生成的系统提示词。这些改动只有在开启新会话,或者触发了“压缩(Compression)”导致的提示词重建时才会生效。 渲染后的格式如下: ------ ═══════════ MEMORY (你的个人笔记) [67% — 1,474/2,200 字符] ═══════════ 用户的项目是一个位于 ~/code/myapi 的 Rust Web 服务,使用 Axum + SQLx § 这台机器运行 Ubuntu 22.04,安装了 Docker 和 Podman § 用户喜欢简洁的回复,讨厌冗长的解释 ------ 这里有几个我非常欣赏的细节设计: 1. 使用字符限制而非 Token 限制:这让记忆逻辑与模型无关。Hermes 不需要调用特定模型的计算工具就能判断记忆是否存满。 2. 简单的分隔符文件格式:条目之间用 § 分隔。没有复杂的向量数据库(Vector DB),没有自定义二进制存储,就是纯文本。 3. 刻意保持极小的系统提示词空间:这是整个设计的重中之重。Hermes 不想把所有历史都塞进提示词,它只想要最有价值的事实。 4. 记忆是“精选状态”,而不是“日记”:这是 Hermes 与 OpenClaw 最大的区别。 OpenClaw 的日志更像是“流水账”。而 Hermes 则反其道而行。它的工具架构和测试逻辑强调: • 保存用户偏好。 • 保存环境事实。 • 保存反复出现的错误修正。 • 保存稳定的规范。 • 不保存任务进度。 • 不保存会话结果。 • 不保存临时的待办事项(TODO)。 真相是:Hermes 希望 MEMORY.md 和 USER.md 保持精简、高频且对缓存友好。 memory 工具 Hermes 通过一个拥有三种操作的 memory 工具来管理这些文件:add(添加)、replace(替换)、remove(移除)。 一个好用的细节是:replace 和 remove 使用子字符串匹配。你不需要记住条目的内部 ID,只需要传入现有条目中一段唯一的文字即可。 此外,系统会拒绝完全重复的内容,并拦截危险信息。源代码会扫描记忆条目,防止提示词注入(Prompt Injection,即通过输入恶意指令误导 AI)、凭证泄露或隐藏的 Unicode 字符。 第二层:用于情景回溯的 session_search 如果说 MEMORY.md 是 Hermes 的“短期热记忆”,那么 session_search 就是它的“长尾回溯系统”。 所有过去的会话都存储在 SQLite 数据库中,拥有完整的索引和搜索功能。当模型需要想起以前聊过的内容时,它不去翻 MEMORY.md,而是搜索这个会话数据库。 其工作流程是: 1. 在过去的消息中进行全文搜索。 2. 按会话分组结果。 3. 加载匹配度最高的会话。 4. 使用一个便宜的辅助模型对这些会话进行摘要总结。 5. 将精炼后的回顾内容返回给主模型。 这是一种非常务实的设计。它比盲目地把长篇累牍的历史塞进每一个提示词要便宜且高效得多。 第三层:压缩与记忆冲刷(Memory Flush) Hermes 另一个聪明之处在于它处理长对话“压缩”的方式。 当会话变得太长,Hermes 会压缩对话中间的部分以节省空间。但摘要是有损的,重要事实可能会丢失。 于是,Hermes 会先进行一次“记忆冲刷”。 在压缩之前,它会发送一条指令告诉模型: > “会话即将压缩,请保存任何值得记住的东西。优先保存用户偏好、修正建议和重复模式,而非具体的任务细节。” 然后它运行一次额外的模型调用,只开启 memory 工具。如果模型觉得有什么东西该留下来,就会在对话被“洗掉”之前把它写入 MEMORY.md。 第四层:作为程序记忆的技能(Skills) Hermes 不仅能记住事实,还能记住技能。 技能(Skills)存储在 ~/.hermes/skills/ 下。当 Hermes 发现了一个复杂的流程、修复了一个棘手的问题或学会了更好的方法时,它可以将其保存为“技能”。 大多数记忆系统只关注“语义回溯”(名字、偏好、事实),但智能体还需要记住如何做事。 为了效率,Hermes 不会把所有技能都塞进提示词,而是只放一个技能索引,只有在需要时才加载具体的技能内容。 第五层:用于深层建模的 Honcho 最后是可选的 Honcho 层。如果说本地记忆是 Hermes 的笔记本,Honcho 就是它尝试构建的复杂用户模型。它能实现跨设备、跨平台的记忆连续性。 最精妙的是它如何在不破坏提示词缓存的前提下实现集成: • 在会话的第一轮,Honcho 的上下文会被织入系统提示词。 • 在之后的对话中,为了保持提示词稳定,Honcho 的回溯内容会附加在当前用户的提问后面,而不是修改系统提示词。 这确保了缓存依然有效,同时 AI 依然能读到最新的背景信息。 Hermes 与 OpenClaw 的区别 • OpenClaw:记忆更接近“以 Markdown 为中心的存储”,日志和长效文件是主要事实来源。 • Hermes:提示词记忆被严格限制,历史记录存在 SQLite 里,只有需要时才搜索。 Hermes 更加关注缓存效率。 它认为:不是所有东西都配住在“系统提示词”这个黄金地段。 总结:Hermes 做对了什么? 1. 冷热分离:小规模提示词记忆负责常驻信息,搜索负责偶尔用到的信息。 2. 缓存优先:它意识到频繁改动提示词会导致延迟增加和成本上升。 3. 记忆的多样性:它承认记忆是分层的——包括个人画像、情景回溯、操作技能和深层建模。 Hermes 的核心设计原则最令我折服:记忆应该让智能体变得更好用,而不是通过摧毁提示词的稳定性来换取博闻强识。 真正的诀窍不是记住更多,而是在正确的层级、以正确的成本,记住正确的事情。
宝玉 tweet media
Manthan Gupta@manthanguptaa

x.com/i/article/2034…

中文
35
271
1.2K
156.5K
Tyrande retuiteado
fin
fin@fi56622380·
AI半导体终局推演2026(I) 当新token经济学范式从GPU算力转移到HBM 本文从从GPU架构进化路线本质出发,解释这个市场长久以来担心的问题: 每个GPU的HBM内存需求为什么一定会是指数增长,为什么HBM需求指数增长不会停滞? 并推导token经济学在当前架构下第一性原理:token吞吐 = HBM size X HBM BW带宽 同时讨论了,为什么GPU的天花板被HBM的两个发展维度所决定 HBM周期性这个话题争议一直很大,乐观派认为AI带来的需求比以前要大的多,但市场主流仍然认为前几次上升周期也有需求每年20%+增长,这次又有什么不一样呢?AI不影响HBM和传统DRAM一样有commodity属性,一旦在需求顶峰扩产遇上需求下行又会重蹈覆辙。 我们可以从算力芯片架构视角,从第一性原理出发,来拆解和推演一下这个问题:为什么这次真的不一样 ------------------------------- 历史:CPU算力时代 很久以来,我们都处在CPU主导算力的时代,CPU的最高级KPI就是performance,跑的更快,所以每一代的CPU都用各种方法来提高跑分,最开始是频率上升,后来是架构演进superscaler等等 这个时候为什么DDR不需要很快的技术进步速度?比如DDR3到DDR5竟然经历了15年之久 因为这个时期的DDR的角色是纯粹的辅助,而且辅助功能极弱,以业界经验,DDR的速度即便是提高一倍,CPU的performance一般只能提高不到20%这个量级 为什么DDR带宽速度提高了用处不大?两个原因 1. CPU设计了各种架构去隐藏 DDR延迟,比如superscaler,加大发射宽度,用海量的ROB和register renaming来提高并行度隐藏延迟,一级缓存cache,二级缓存cache,削弱了DDR的带宽速度需求 2. CPU workload对DDR带宽要求并不高,大部分日常负载比如打开网页,DDR带宽是严重过剩的,甚至云端负载 也就是说,在CPU时代,DDR的带宽速度是不太有所谓的,DDR4和DDR5除了少数游戏就没啥差别,甚至JEDEC标准也进步缓慢。 另外,绝大部分app需要一直停留在DDR上的部分并不多,需要的时候从硬盘上调度到DDR即可,app的size增长没那么快,导致对DDR的容量需求也较为缓慢。 所以最近十年来,平均每台电脑上的DDR容量大概从7~8GB变成了23GB,十年只增长了3倍。 而这部分升级缓慢直接影响了营收,size容量计价是赚钱的主要方式,速度的提高只是技术升级,提高size的单价,这两个的升级需求都不大,需求主要是随着电脑/手机数量增长而增长 所以DRAM在带宽速度和容量这两个维度上,一直是都是芯片产业锦上添花性质的附属品,DDR升级带来的边际效用是很低的,跟CPU时代的最高KPI几乎没什么直接联系 -------------------------------------------- 而到了genAI 大模型为主导的新时代,计算范式转移让最高级KPI起了根本变化 GPU发展到AI推理的时代,不再像CPU那样只看跑分,最高级的KPI不再是算力TOPS/FLOPS,而是token的成本,特别是单位成本/单位电力下的overall token throuput 其次是token吞吐速度,因为在agent时代,很多任务变成了串行,token吞吐速度成了用户体验的重要瓶颈。 这也是为什么老黄发明AI工厂概念的原因:最低成本的输出最多token,同时尽量提高token吞吐速度 AI训练时代,老黄的经济学是TCO(total cost ownership),买的GPU越多,省的越多 而老黄在推理时代的token经济学是: AI推理的毛利润很可观,所以逻辑已经转换成:Nvidia GPU是这个世界上让token单价最便宜的GPU,买的GPU越多,赚的越多 最高的KPI变成了Pareto frontier曲线,在提高token 吞吐throughput和提高token速度两个维度上尽量优化 (见图一) NVIDIA 的 token factory 代际进步,其实是在把整条 Pareto frontier 往右上推,这就是是AI推理这个时代最重要的KPI ---------------------------------- 接下来是本文最重要的逻辑链,如何从token吞吐量指数型增长的本质出发,推导出天花板瓶颈在HBM size和HBM 带宽的指数型增长 单卡GPU推理单线程batch size = 1的时代,token吞吐只有一个维度,就是HBM的带宽速度,带宽速度越高,token吞吐越大 但进入NVL72的年代,推理不再是单卡GPU时代,而是72个GPU + 36个CPU整个系统级别的token工厂,把HBM带宽和算力用满,获得极致的token吞吐量 Token 吞吐throughput的增长,依赖两个东西:同时批处理的请求数 X 每个user请求的平均token速度 也就是batch size X per user token 速度 以Rubin NVL72为例,在平均token速度是100 token/s的情况下,同时批处理1920个请求,得到token吞吐量是19.2万token/s 一个Rubin NVL72大概是120KW(0.12MW)的功率,所以得到单位MW能处理1.6M token/s (见图一) 所以,我们需要想方设法提高这两个参数:批处理数量batch size和per user token的平均速度,这两者相乘就是我们的最高KPI,也就是token的吞吐量 ------- 第一个参数:batch size的增长,瓶颈在HBM size 批处理量里的每一个请求req,都会自带kv cache,这部分kv cache是需要存在HBM里的,大小大概在几个GB到数十GB不等 因为hot kv cache是随时需要高频高速读取,所以必须放在HBM里,比如一个大模型的层数是80层,那么每一个token的生成阶段,都需要读取80次HBM里的kv cache 随着批处理数量batch size的增长,会带来hot kv cache的线性增长 又因为这个批处理量的所有请求的hot kv cache,都要放在HBM上,这也就带来了HBM size必须要随着批处理量batch size线性增长 就像是机场接驳车,登机口尽量快的接旅客到飞机,HBM size小了,相当于接驳车size小了,就得多接一趟 结论是:批处理量的数量batch size,瓶颈依赖于HBM size的增长 --------- 第二个参数:每个user请求的平均token速度,瓶颈在HBM带宽 大模型decode阶段的速度,瓶颈取决于HBM的带宽速度,因为每生成一个 token,都要把激活的权重和kv cache 读很多遍 LPU的出现,在batch不那么大的情况下,把激活权重这个部分搬到了SRAM上,但是每生成一个 token仍然要从HBM读很多次KV cache。HBM带宽越高,生成每一个token的速度也就越快,基本上是线性对应的 就像是机场接驳车,登机口尽量快的接旅客到飞机,hbm本身带宽速度就像是接驳车的车门有多宽,门越宽,旅客上接驳车越快 GPU的其他配置,都是在适配batch的增长以及要让token compute的速度配平HBM的增长,甚至会用多余的算力来获得部分的带宽(比如部分带宽压缩技术) —----- 在那个接驳车的比喻例子里 接驳车的车厢大小 = HBM Size(容量): 决定了一次能装下多少名旅客(也就是能同时装下多少个请求的 KV Cache)。车厢越大,一次能拉载的旅客(Batch Size)就越多。如果车太小,想拉100个人就得分两趟,系统整体的吞吐量就上不去。 接驳车的车门宽度 = HBM Bandwidth(带宽): 决定了旅客上下车的速度。门越宽,大家呼啦啦一下全上去了(Decode/生成Token的速度极快)。如果门很窄,哪怕车厢巨大能装200人,大家也得排着队一个一个挤上去,全耗在上下车的时间里了。 旅客的吞吐量 = 接驳车车厢容量 x 接驳车旅客上车速度(车门宽度) —--------------------------- 至此,我们从逻辑上推演出了token经济学的硬件需求第一性原理: Token throughput = HBM size X HBM Bandwidth AI推理这个时代的最高KPI,实际上是高度依赖于HBM的两个维度的进步的 如果要维持token throuput每一代两倍的增长,实际上意味着,每一代的单GPU上,HBM size X HBM BW带宽之积要增长两倍! 这也是历史上第一次,HBM内存的size可以影响最高的KPI token throughput! 要验证这个理论,可以把Nvidia从A100到Rubin Ultra这几代的token 吞吐throughput,和HBM size X HBM BW 放在同一个图里比较 (见图二) 可以发现,这两个曲线的走势在对数轴上惊人的一致 HBM size x HBM带宽增长的甚至要比token吞吐量更快,毕竟HBM决定的是天花板,实际上这个天花板增长的利用率utilization是很难达到100%的,也就是说,HBM size x HBM 带宽就算增长1000倍,其他算力和架构的配合下,很难把这1000倍的天花板潜力全部榨干 这条曲线不是巧合,而是系统最优化的必然解 throughput = batch × Bandwidth,这就是token factory 经济学最绕不开的第一性原理 —-------- 软件的影响呢?软件的优化会不会降低带宽的需求?降低HBM的需求? 这跟硬件是独立两个维度的,这好像在问,如果CPU上的软件优化了之后跑的更快,是不是CPU就十年不用发展了?反正软件跑的更快了嘛 这样的话,CPU厂还能赚得到钱吗?CPU想要存活下去,只有一条路可走,在标准benchmark,不考虑软件优化,每一代CPU必须要跑分更高,不然就卖不出去 GPU也是一样,软件优化如何,和自己的token吞吐量KPI每年都要大幅进步,是两回事 只要token的需求继续增长,对token throuput的追求就绝不会停止,那么对HBM size X HBM 带宽的追求也不会停止 如果HBM size和HBM 带宽发展慢了,老黄一定会亲自到御三家逼着他们技术升级,因为这就是老黄gpu的天花板,天花板要是钉死了不进步,老黄的GPU还能卖出去吗? 当然了,Nvidia需要绞尽脑汁去从异构计算的架构角度榨取HBM天花板之外的部分,比如LPU就是一个很好的尝试,把Pareto frontier从另一个角度改善了很多 (右半边高token速度的部分) —-------------------------------------- HBM内存已然告别了那个随波逐流的旧时代,在这条由指数级需求铺就的单行道上,以一种近乎宿命的方式走到了产业史诗的主舞台中央 推理范式第一性原理演化到这一步,只要老黄还要卖GPU,HBM就必须翻倍,而且必须代代翻倍。这是supply side的内生压力,与AI需求无关,与宏观周期无关,与hyperscaler的心情也无关 剩下的问题,只有一个: 当需求被物理锁定为指数增长的时候,供给侧的三个玩家,会不会还像过去三十年那样,亲手把自己再拖回一次周期的泥潭?
fin tweet mediafin tweet media
fin@fi56622380

回顾2025年半导体市场,真的是有太多太多精彩的故事,最大的主题就是: AI需求驱动导致半导体基建的估值体系重构 + 产业链的价值分配重写 从2024年开始,半导体基建正在飞速吞噬整个IT产业利润,SP500里半导体净利润EPS在IT行业里占比,在两年时间从不到20%上升了到了40%,而且还在呈加速上升姿态 半导体整体前瞻利润率从2023年的25%已经升到了2025年11月的43%,已经明显超过了几个互联网巨头的平均利润率,这也印证了半导体利润率超过互联网会是新常态。整个IT产业的利润分配,流向半导体的比例越来越大。 要知道,就算是20~22年的半导体芯片荒,短缺如此严重,半导体的利润率和整个IT利润分配也没有显著增长 这就是故事的上半篇:AI需求驱动导致半导体基建的估值体系重构,不再是互联网时期的基建从属地位 ------------------------ 这个现象背后的逻辑是商业模式随着技术特性的变迁: 互联网时代,每次请求的网络和算力成本,边际成本极低,scaling的效果极好,分发的边际成本几乎为零 在AI时代,这个互联网时代分发边际成本几乎为零利于scalable的特性遭遇了根本性的重大挑战:且不说训练成本从此不是一次性开销而是年年增长,就客户的AI推理请求而言,由于inference scaling成为共识,加上垂直领域仍然需要更大规模的旗舰模型来保持竞争力,推理的成本不会随着硬件算力价格的通缩而同步降低 互联网企业从前的最大成本只有OPEX尤其是SDE人工成本,而现在,互联网公司历史上第一次像半导体厂foundry那样背上高折旧成本的资产负债表,商业模型恨不得要慢慢从“流量 × 转化率”部分转向“每 token 毛利”了 简单的说,互联网时代到AI时代的成本分布,在人力成本opex的基础上又加上了沉重的硬件/算力成本capex(财报里占比:MSFT 33%, Meta 38%)。 上个时代的互联网公司+CSP+SAAS是收租行业里的大赢家,而AI时代,算力(半导体/芯片折旧)成为了新的收租行业,整个IT行业的利润分布发生了剧烈的重新分配(EPS利润流向半导体从20%升到40%而且持续攀升中),这就是半导体基建估值体系重构最重要的原因 --------------- 半导体高利润率的新常态趋势能持续多久? 目前的高溢价来自于前期不计成本的军备竞赛造成的半导体订单积压过多 但很显然,hyperscalers都不愿意当冤大头,都在试图自建ASIC降低成本,那么可以从2030年远期的算力分布来回看这个问题 长线来看,openai已经明牌了标准答案,10GW Nvidia,10GW ASIC,6GW AMD,其他hyperscaler划分比例有类似考虑 比如说,推理端希望ASIC >50%,GPU里再细分的话,AMD和NV(legacy)对半分。训练还是得NV占大头,60%+,剩下的自研ASIC和AMD对半分 2030年按60%推理,40%训练比例划分,算下来NV 38%, ASIC 39%, AMD 23%,跟openAI比例是几乎完全一致的,算是一个标准答案参考值 当然了,微软,Amazon,Google,Anthropic这几家里AMD的比例会比这个标准答案中枢/参考值明显低一些,xAI则是没有ASIC只有Nvidia+少量AMD AMD的风险在于,当2030年再往后的更长期,CSP的in house ASIC越来越成熟(微软除外),推理端ASIC占比可能越来越高,很难有incentive新买入大量GPU了,除非卖的足够便宜 最近风头正劲的TPU呢?Meta是不是要转向TPU?对Nvidia的利润率影响大吗? 实际上,Meta今年capex72B,明年capex110B,未来六年capex平均值可能达到160B附近,而Meta 6年10B的TPU订单算下来年均只有1.6B,而且购买的是TPU云服务,并不是裸TPU 也就是说,Meta这笔TPU订单只占到Meta未来6年capex的1%,并没有严肃的考虑大规模部署,可能只是作为和Nvidia讨价还价的手段而已 另外从Meta最近几个月的招聘广告来看,也并没有看到任何TPU engineer方面的招聘,不像 Anthropic那样从五月就招一堆TPU kernel engineer,十月才宣布大规模采购TPU做训练 所以说,不管原因是diversify供货商,还是给自研ASIC延迟做退路,还是因为AMD的MI350X延迟,Meta买TPU基本上只有一个考虑:增加买Nvidia GPU的议价权,但顶多只有推理份额里能讨价还价,实际效果很有限,对Nvidia利润率影响也很有限。 要知道,22年加密货币熊市矿难的时候,NVDA库存上升到了198天,利润率只是从65%回撤到了56%,算上PE/宏观双杀股价才从300变100,现在一直供不应求,利润率没道理能降下来 再加上TPU v8设计过于保守(没用HBM4),Kyber rack的Rubin方案会比TPU v8的TCO更好,到头来最后还是得继续依赖Nvidia,很难议价。只要Nvidia继续保持这样的大踏步前进,竞争对手其实要跟上还是不容易的。 总之,一方面,全产业链瓶颈,比如cowos扩张都很谨慎,供不应求的状态还能持续多年。 另一方面,AI变现的利润曲线和硬件投入曲线存在“时间错配”,应用端的增长曲线会落后几年,只要这个应用端和基建端的增长曲线的时间错位依旧存在,半导体在IT行业的利润分配就会一直占优势。 从OpenAI的到2030年的投入曲线来看,这个时间错位至少要持续到2030年附近。也就是说半导体行业的超级扩张期带来的在IT产业利润划分的主导地位,目前看至少能持续到2030年 而半导体高利润率可能会维持的更长远一些,因为从互联网时代一次性基建属性变成了现在的收租基建属性 --------------------------------------------------- AI 不是只养活了 GPU,而是在用算力预算把“能把电变成 token 的每一环”都抬了一轮,从内存,存储,互联,光纤,电力,储能…..等等 上半篇讲完了“半导体吞噬IT利润”,那么下半篇讲的就是“AI算力价值溢出效应(Spillover Effect)重塑半导体内部格局”:GPU算力增长 -> 内存/存储/互联/CPU瓶颈 -> 溢出效应 -> 结构性机会 2025 年更有趣的故事,是巨大的行业红利在半导体内部怎么诞生结构性新机会,比如说,一个super cluster需要几个数据中心互联,光纤互联的长度需要上百万mile这个级别,这就是新机会 半导体产业链的结构性趋势带来的新机会,最典型的例子就是内存(DRAM/HBM)和存储(SSD),HBM的需求增长太夸张,连带挤压DDR4/5产能,直接让以周期性为标志的内存行业甚至喊出了“周期不存在”了,Hynix因为在HBM上领先,甚至都开始憧憬起了几年后年利润1000亿美元,妥妥一个万亿市值的公司 这两个板块背后,是结构性趋势的转变:AI workload从训练逐渐往推理延申,推理比例越来越大。 而推理是一个非常纯粹的吃内存带宽速度(memory bound)的事情,可以说带宽速度=token/s。模型尺寸越来越大,以及上下文context length的增加,对内存的尺寸要求也相应增大,导致了内存的需求激增:推理即内存 下一代的的GPU/ASIC内存已经成了暴力美学,配备的内存size之巨大,是三年前无法想象的,回看22年H100的80GB简直像个玩具,这才几年就增长了十倍: Nvidia Ultra Rubin - 1024GB HBM Qualcomm AI200 - 768GB LPDDR AMD MI400x - 432GB HBM 内存的另外一个潜在的爆发点在端侧,也就是手机/PC/汽车/机器人的端侧LLM,这两年主流的手机旗舰机已经从6GB升级到了8GB/12GB/16GB,提前为可能的端侧LLM生态做准备,毕竟手机算力下一代就能达到150TOPS量级,妥妥的桌面级,非常暴力 潜力上来说,端侧内存升级是比云端内存增量要更大的市场,毕竟端侧终端device的数量太惊人了,每年都是billion级别,一旦端侧LLM生态繁荣起来,内存用量翻倍轻而易举,针对端侧低功耗内存/存算一体的各种设计都会跟上 但端侧genAI的软件生态,似乎明显滞后,一直比我想象的进度要慢,可能是因为这方面还处于摸索期,并没有云端那么确定的ROI,厂商们在投入上都很谨慎,我在23~24年时候看好27年,可能还是太乐观了 互联网->移动互联网用了10~15年,端侧genAI/LLM可能也需要7~10年,可能得等云端ROI开发的差不多了,边际收益下降了,才能轮得到端侧genAI/LLM拿到开发资源,跑通端侧ROI。 -------------------------------------- 另一个2025年半导体内部结构性转变的故事是NAND存储,特别是企业级eSSD硬盘 结构性趋势来源也是同一个,AI workload的推理需求越来越大。内存红利也外溢到了SSD存储,甚至HDD存储,因为内存不够用就用高速SSD作为多级缓存 主要逻辑是AI推理过程中内存溢出KV cache offloading到下一层SSD存储,以及向量数据库检索/indexing,都在增加SSD存储的需求 Micron财报说的精准又直白:“AI inference use cases such as KV cache tiering and vector database search and indexing, are driving demand for performance storage.” 至于为什么存储价格在第四季度才爆发,这需要区分一下合约价格和现货价格,合约价格涨幅会温和一些,就算是最紧缺的企业级eSSD合约Q4上涨大概25%。而当NAND产能在2025年被合约慢慢的吃光,现货的价格就造成了观感上强烈的冲击,一个月上涨50%以上。 另一个未经验证的逻辑是多模态的爆发,特别是AI图片和AI视频的需求爆发,也会加剧存储的短缺,我觉得这条线只能说未来可期,但目前的视频/图片精细程度,可能还不到当年GPT3的水平,要达到出圈效果还需要一些时日。 ------------------------ 那么下一步还有什么趋势转移带来的半导体结构性的机会呢 那么就要先看下一步AI推理端的需求趋势是什么,毫无疑问,agentic flow的比例会越来越大,2025并不是year of agent,而是一个decade of agent 从CPU视角去看agentic workload,routing和工具处理都在CPU上,如果把常用的agentic框架做profiling,比如SWE-Agent, LangChain, Toolformer,CPU最长可以占到90%的E2E端到端延迟,throughput瓶颈也更多的卡在CPU,甚至CPU能耗也超过了总能耗的40% Agentic AI目前是一个CPU瓶颈更多的事情,在 agentic 框架里,CPU 是永远在忙的总指挥orchestrator, 很可能会成就CPU需求的新一波回暖 AMD 2025年Q2财报(8月5日),Lisa Su明确表述了这一现象:​"In particular, adoption of agentic AI is creating additional demand for general-purpose compute infrastructure, as customers quickly realize that each token generated by a GPU triggers multiple CPU-intensive tasks." "agent AI的采用正在对通用计算基础架构产生额外的需求,因为客户很快就意识到GPU产生的每个令牌都会触发多个CPU密集型任务。" ​Q3 财报里Lisa又明牌了一次CPU TAM increasing due to Gen AI. "Many customers are now planning substantially larger CPU build outs over the coming quarters to support increased demands from AI, serving as a powerful new catalyst for our server business." Nvidia也是把agent flow视为CPU需求,GB200/300 架构配置的CPU比例也比以往大的多,36颗 Grace CPU : 72颗 Blackwell GPU,直接达到了1:2的水平,AMD的路线则是用1~4个256核的EPYC去服务MI400系列72~128个GPU 以后的硬件架构,一定会往优化agent workload方向发展,比如agent task graph的调度和load balancing,CPU/GPU协同micro-batching 算力上的比较,说不定以后也会摆脱现在的纯GPU token rate比较,转向整个系统级全栈agentic benchmark比较. -------------------------- 半导体结构性转变带来的机会同时,下一步,可能也会带来一些意想不到的次生效应 云端AI数据中心需求爆发,造成内存和存储的暴涨,给消费电子的成本带来了很大压力,在2026年,这也许会演变成消费电子产业潜在的黑天鹅 PC厂商最近的股票大跌,也是这个原因。HP已经说了要减少内存配置,暗示要把PC重回8GB内存+256GB存储的时代了。 DRAM内存和存储再这么涨下去,可能会出现很离谱的情况:内存/存储现货价格比CPU和GPU还要更贵。尴尬的是,这可能直接延缓了消费电子期望的AI PC的进程,毕竟大内存是更有利AI PC的表现力的。 夸张的说,每个PC厂商和手机厂商的员工,甚至是消费电子厂商的员工,都应该买入存储和内存,作为职业风险对冲 明年年初开始,安卓阵营的内存以及存储成本要压不住了,三星,小米的手机售价都提高的话(美国市场现在已经提高不少了),利好最大的就是苹果 苹果的内存产能,nand产能都是专属长约锁价特供的,顺带还把Kioxia给坑了好多不涨价产能,导致苹果的成本优势进一步扩大,苹果全球手机销量市占率增长可能会非常可观,接下来一阵子可能会是iphone辉煌的时光。 ----------------------- 2025年半导体市场真的是太多精彩的故事了,Nvidia/AMD/TPU和各家hyperscaler的恩怨情仇引得各路下注的吃瓜群众心情跌宕起伏。 HBM/内存厂商吃到了memory-bound的红利,NAND厂商意外收获了KV cache的溢出效应,CPU在沉寂近十年后,可能会因agent orchestration再次回到增长叙事的中心 不再是Nvidia/AVGO几家算力厂商独大,而是AI workload算力价值溢出后的每一次演进,从训练到推理,从文本到多模态,从单模型调用到agentic flow,都在重写产业链的价值分配。 云端AI的繁荣正在挤压消费电子的生存空间——当PC厂商被迫讨论重回8GB时代,苹果却因供应链优势坐收渔利。这场算力军备竞赛的次生效应,可能在2026年以意想不到的方式重塑整个消费电子格局 半导体的故事不再是一条单线,而是一张持续自我重构的网。而 2025 年,大概只是合纵连横的第一回合

中文
71
318
1.1K
573.4K
Tyrande retuiteado
pepper 花椒 (赚钱版)
pepper 花椒 (赚钱版)@off_thetarget·
已经不止有多个项目找我测一测他们的AI trading架构了 我就简单说几点吧 1. 拿长期实盘出来,短期妖币这种没有 max dd 的不代表什么,幸存者偏差而已。随便挑一个已经归零的币倒着回测,曲线一样漂亮 2. 如果 Sharpe ratio > 5,基本上可以确定是过拟合、look-ahead bias 或者数据泄漏。Medallion 常年也就 2-3,你一个人在家跑出 7,自己心里要有b数 3. 你拿一段 crypto bull market 的数据去测,和你拿一段大类市场的数据回测是不一样的,完全的 overfitting,基本我不看。最起码 2018、2022 两轮熊市能走通,再跑一轮 walk-forward,才算一个策略 4. 手续费、滑点、funding rate 都得建进去。Binance 的 maker/taker、VIP 档位、BNB 折扣一层层算下来,模型不准的话 backtest 和实盘能差出一倍年化,这是常态 5. 策略容量比收益率更值得看。10 万刀跑得动,不代表 100 万刀还能跑。小币深度就那么点,你一进场自己就把自己的信号打掉,backtest 里完全 reflect 不出来 6. 确实 crypto quant 没那么卷,但套利机会一直在被蚕食——funding arb、现货期货 basis、跨所价差,基本已经被做市商和 HFT 吃干净了。高频做不了,纯因子也没空间,剩下能做的只有趋势和 mean reversion 这两条老路 7. Alpha 有半衰期。策略上线三个月还能跑,算及格;半年还在,算不错;一年还有,大概率是运气好或者你的规模还没到引起注意的量级。别把一次 bull run 的红利当永续 alpha,你还没有那么牛逼 8. Grid search 出来的"最优参数"99% 是过拟合。真正稳的参数,是你在一个区间里随便挑都能跑,而不是精确到小数点后两位才 work。参数稳健性比单点收益重要一百倍,这点做过的人都懂 9. 2017 ICO、2020 DeFi summer、2021 meme、2022 LUNA/FTX、2023 AI 叙事,每一段市场结构完全不同。你在上一段拟合出来的"规律",换个 regime 直接归零,还倒亏手续费 10. 交易所风险永远比你想的大。FTX 归零、API 限流、插针爆仓、小所跑路、币安突然下架,这些都是"一次就结束游戏"的事。你年化 50% 抵不过一次交易所暴雷,这跟策略多牛逼没关系,做山寨的就要考虑到流动性和“下架风险” 11. backtest 上曲线波动看着很美,真到自己账户里连续三周净值下跌,90% 的人会关掉程序手动调参 12. 分清楚你赚的是 alpha 还是 beta。牛市里所有人都是 quant 大师,熊市一来只剩 beta 的人全被冲走。把多头暴露剥离出来单独看 alpha 曲线,大多数所谓"策略"根本没 alpha,就是变相 long BTC 加一点波动率。 13. ML 在 quant 里有大量虚假繁荣。LSTM、Transformer、强化学习被吹上天,实际在 SNR 极低的金融时序上,一个朴素动量因子加合理风控,能打过你调一万次的 XGBoost 真JB学习起来,quant是真的难得一笔
中文
38
47
370
114.1K
沈彤
沈彤@jessyshen·
杜均老板投了一个公司,华南给各大工厂装AI插件 99%的人对着AI对话框懵逼,他们去装老板们能理解的插件 对,没错 你如果懂,manus改一改就行 问题是,你有没有决心地推去装? 每月净利润1000多万人民币 相比币圈那些还在鸡飞狗跳的同行 杜均已经蜕变了,这只是他投的其中一个项目
中文
5
2
47
8.9K
Tyrande
Tyrande@tyrandeB·
@labubu_trader What about Groq? Does its tech just put memory closer but doesn't reduce memory footprint?
English
1
0
0
125
3X Long Labubu
3X Long Labubu@labubu_trader·
But still, the memory is still the bottleneck after so long, lol
English
1
0
14
4.4K
3X Long Labubu
3X Long Labubu@labubu_trader·
I'd treat this as the DeepSeek moment for memory names(SK Hynix, Samsung, Micron) I checked the original paper: arxiv.org/pdf/2504.19874, it's not surprising to me that new quantization method will get better and better. And since KV Cache is the bottleneck for lots of agentic use cases(long context window), there will be more and more optimization trying to compress the size and save the memory bandwidth. However, reduce the KV cache by 10X that doesn't mean the economic demand to HBM/DDR will shrink in the future(Jevons paradox) I already bought the dip when $MU had the 2nd leg intraday to test the LOD but didn't break down further.
English
14
12
209
102.4K
Tyrande
Tyrande@tyrandeB·
@CryptoPainter 程序员的主要工作是数据读取/清洗,还有交易执行,风控系统。对于有很多交易员的大机构来说比较重要,毕竟不能让交易员拿着公司的钱乱赌,但是小作坊恰恰可以省去需要程序员的部分,写个pine script其实也可以开工了 😂
中文
0
0
1
705
Crypto_Painter
Crypto_Painter@CryptoPainter·
两个通宵,自进化量化系统终于搞出来了... 说实话是真的费钱... GPT5.4花了500u,Claude花掉了500U,然后跑了一遍,迭代出来的首个动态策略年化23%,最大回撤17%,远远不及我的预期... 于是又找 Gemini3.1 去给我出主意,在此期间订阅了Ultra,还升级了Cursor的会员,又是300u... 结果就是... 花了1300u,搞出来一个表现和双均线策略差不多的玩意儿... 虽然我知道它理论上可以不断生成各种策略,但心态真的有点崩... 我就想问,给专门搞量化的程序员付上1万rmb,这东西能写出来吗?
Crypto_Painter tweet media
Crypto_Painter@CryptoPainter

更新一下目前的进展,真的是挺焦虑的: 三个系统全部搭建好了,而且相互之间的调用接口也跑通了,但当我开始实测使用系统C进行 HMM 训练时,AI和我产生了严重的意见分歧... 我认为判断市场结构是否处于震荡还是趋势,用4h或1d数据就可以,但 AI 却强烈要求使用15min数据来训练... 因为我给 Agent 加了“意见不合时可以强烈反对并不执行”的设定,所以我花了一晚上才说服他,毕竟15min的全量数据实在太大了,而且用来判断市场结构也是偏向微观的... 然后就是随着整个大系统越来越复杂,每次有一点小BUG,就要来来回回修很久,因为三个系统之间接口和架构需要连锁适应,所以我体感上感觉整个项目的进度越来越慢了... 不知道你们 Vibe Coding 的时候有没有这种感觉? 我到了后期甚至怀疑 AI 在有意通过放慢执行效率来让我烧更多 Token... 而且这个倾向会随着上下文的增加而逐步增强... 真的有点细思极恐...

中文
180
95
704
243.1K
Tyrande retuiteado
cvxv666
cvxv666@antpalkin·
Chinese quant built a simulation of how SPX price reacts to any global event. He’s already made over $100k - with full blockchain proof. He knows exactly where price will go. More than 40 years of SPX trading history have been loaded into MiroFish simulator (18k stars on GitHub) AI analyzed every single moment in that trading history. Now this guy has a fully functional SPX price prediction system. His wallet: @moisturizer?via=cvxv666" target="_blank" rel="nofollow noopener">polymarket.com/@moisturizer?v… Dozens of successful SPX price-prediction trades and hundreds of tests across other stock markets. Here’s exactly what you need to replicate his stack: - market data APIs (SPX price, use Alpha Vantage or Quandl) - data pipeline (use Python) - feature engineering (for output signals like RSI, MACD) - seed dataset for MiroFish (convert data into structured context) - multi-agent simulation (macro strategist, earnings analyst, sentiment analyst agents etc.) - probability forecast (run different scenarios) - trading / decision Model (SPX futures ES, SPY ETF) Save this pipeline if you want to run a similar simulation on your own data. You can feed the whole thing to your Claude and build your first (even small) simulation model together.
cvxv666 tweet media
English
101
422
3.5K
2.4M
Tyrande
Tyrande@tyrandeB·
@coolish @hazenlee 如果 netflix 的 AIGC 定制套餐是“让我喜欢的小鲜肉重新演一遍 xxx”,这个套餐会不会卖爆?所有的遗憾都可以弥补,还可以挑选20岁的小李子。。。
中文
0
0
0
345
paulwei
paulwei@coolish·
@hazenlee 一个传言,腾讯这样的盘子开盘都能这样😅 那要是传言 Netflix 推出 AIGC 订阅套餐的话会怎么样?😅
paulwei tweet media
中文
2
0
4
4.7K
𝙃𝘼𝙕𝙀𝙉𝙇𝙀𝙀
好了 腾讯也开始发力ai了 之前的腾讯空单明早开盘获利了结了 差不多了
𝙃𝘼𝙕𝙀𝙉𝙇𝙀𝙀 tweet media
中文
4
0
29
18.1K
Tyrande retuiteado
Sac
Sac@Saccc_c·
20岁大四学生,用10天Vibe Coding手搓出来的开源项目:MiroFish,连续3天霸占GitHub Trending榜单前列,目前Star数已狂飙至8.3k,且还在持续增长中。 盛大创始人陈天桥看了Demo后,24小时内当场拍板注资3000万。 它是一个「预测万物」的 AI 仿真沙盘。只要丢给它一段新闻、政策或金融信号,它会自动生成成千上万个具备独立人格的 AI Agent,直接推演出未来的发展方向。 当你还在靠人工收集数据、靠经验做判断时,此项目已经开始用成千上万个 agent替自己预演未来了。 仓库地址:github.com/666ghj/MiroFish
Sac tweet media
Sac@Saccc_c

x.com/i/article/2030…

中文
216
1.3K
6.4K
1.4M
Tyrande retuiteado
yourQuantGuy
yourQuantGuy@yourQuantGuy·
分享一个 Alpha,这个月我“只”撸了几万u 事情是这样的,我前段时间不是开始定投 Hype 了吗? 然后我就想着能不能通过期权再增加点收益,一点点也行 就去看了一下各个平台的价格和流动性,结果,这价差大到吓人,按照年化算,能有 1000% 😳 (图1) 而且不是什么复杂的期权结构,就是在一个交易所买一手期权,再去另一个交易所卖一手同样行权价和到期日的期权。 我担心有什么坑,于是只买了一点点试水。几天后到期了,居然一点坑都没有。 于是我开始下单买更多,但是开始贪心了,只想买那些到期日近的,变现快的,放弃了那些远期但套利收益其实更高的期权。 结果还不到一周,套利的机会就没了,明明如果大扫货的话能暴富的,最后却“只”撸了几万u 🥲 虽然这个 alpha 过期了,但是有心的朋友还是可以监控一下,偶尔还是有套利的机会可以小额赚个20%左右的年化,尤其是如果你用统一保证金且账户里本来就有资金,那就是顺便赚的了。(图2)
yourQuantGuy tweet mediayourQuantGuy tweet media
中文
19
30
278
88.4K
Tyrande retuiteado
leifu _/
leifu _/@leifuchen·
昨天转发了一篇用 Deribit 波动率曲面推导 Polymarket 二元期权定价的思路。一位做 PM 自动化交易的大哥@jtrevorchapman 告诉我,他几个月前试过类似的路径,结论是在 15 分钟尺度上,波动率曲面能给的信息,市场微结构信号可以更快更准地捕捉到。 我赶紧去看了大哥的实盘,发现他当前使用的交易系统表现非常优秀,盈利因子 4.29(每亏 $1,能赚回 $4.29),胜率 93%,而且他有问必答毫无保留。 热心哥的核心系统是一个三层架构:记忆 → 信号 → 防御 1. 记忆层 每个 session 开始,先扫描最近 30 +个已结束的 session,找出最像当前盘面的历史 session。比如当前 BTC 价格在某个位置、波动率是某个水平、市场情绪是某个状态,在过去类似的session中,最后结果是 UP 赢得多还是 DOWN 赢得多?如果是 UP 多,那么系统会带着这个“历史经验”(先验偏差)进入下一层。 2. 信号层 这层关注实时数据,每秒钟运行8-12条规则,然后独立投票UP / DOWN + 置信度(0-100%)。这些规则中热心哥认为 CVD(累计主动买卖量差)是预测力最强的单一指标。其他还有预言机报价距离、 Binance 动量、订单簿不平衡、UP / DOWN 代币价格走势(反映 PM 上所有参与者的集体判断)。 所有规则按置信度加权,得出方向和综合置信度,如“方向 YES,综合置信度约 65%”。 3. 防御层 方向确定后,用五个因子算出一个 0-1 系数,直接乘到仓位上,1 就是全仓执行,0 就不做。所以同样一个"65% 置信度 YES"的信号,根据防御层的评估,仓位大小也会有区别。这五个因子如下: - CVD 同不同意?如果信号层说 UP,但 Binance 上的净卖压很大(CVD 不同意),仓位直接大幅压缩。CVD是热心哥极其看重的因子,在session混乱的情况下(预言机报价反复穿越基准价格 5 次),CVD 甚至有一票否决权(系数降为 0)。 - 距离基准价格多少?如果 BTC 现价和基准价咬得很紧,说明随时可能翻盘,需要压缩仓位。 - session 剩多少时间?如果只剩最后两三分钟,任何突发波动都来不及反应,风险陡增。 - 当前 session 预言机报价反复穿越了基准价格几次?超过 5 次就算混乱。混乱市场里信号可靠性大打折扣,仓位要激进压缩。 - 当前入场价的利润空间够不够?入场价越高,对胜率的要求也越高,所以系统在高价位时对信号可信度要求极高。比如 $0.95 入场时,只允许最无歧义最干净的信号通过。 除了核心系统之外,热心哥还提过几个额外细节: - 只做 BTC,不做 ETH 市场,估计是 ETH 的信号不稳定 - 用 40 天、每 200 毫秒记录一次的数据做回测,发现在 session 剩余 6 分钟的时候指标才开始可靠。他用这个来衡量反转风险,过滤掉不该进的session。 限于时间没有全部整理完,他时间线上还有很多细节,推荐去翻翻。原文来自这篇回复: x.com/jtrevorchapman…
leifu _/ tweet media
Trevor Chapman@jtrevorchapman

three-layer system: Memory > Signals > Defense. Layer 1 Session Memory (the prior)... before ANY signals fire, the system already has an opinion. It scans the last 30+ completed sessions and asks: 'when past sessions LOOKED like this one, which side won?" It computes a YES win rate from historical data. This becomes a directional "prior"... a starting bias before the current session even begins. If history says YES wins 65% of the time, the system enters the session already leaning YES. Layer 2: Real-time Signal Voting Every second, 8-12 signal rules evaluate current market conditions. Each rule independently votes YES or NO with a confidence score (0-100%). Example: "Chainlink oracle is $150 above the ptb -> YES, 70% confidence" "Binance 60s momentum is strongly negative -> NO, 55% confidence" '5m CVD shows heavy buying pressure -> YES, 80% conf" These votes get aggregated: winning direction is determined by majority vote weighted by confidence. The final confidence score is the weighted average so if 8 rules say YES at 60-80% and 2 say NO at 40%, you get ~65% YES confidence. Layer 3: defense dampening/sentinel A 65% confidence signal DOESN'T mean a 65%-sized trade. The Sentinel risk system asks five questions: Does Binance flow (CVD) agree with this trade? If not -> dampen hard How far is the oracle from the ptb, price to beat? Tiny spread -> dampen How much time is left? Early session = safer; late session with thin margin = risky How choppy is this session? 5+ reversals = chaos -> dampen aggressively What's the profit margin at this entry price? 0.95 entry = only 0.05 margin -> need near-perfect WR These five factors produce a composite risk score (0.0 = safe, 1.0 = maximum risk) which gets converted into a dampener (1.0 = full size, 0.0 = skip entirely). so... a trade that starts as "65% confident, $5 position" might get dampened to $1.50 because CVD disagrees and the session is choppy. Or it might get boosted to $7 because all 5 risk factors are green and it's a clean trending session. The sIGNAL picks direction. The SENTINEL picks size. Defense generates the alpha, not offense.

中文
17
85
364
28.9K
Tyrande retuiteado
开发者Hailey
开发者Hailey@IndieDevHailey·
还不知道小龙虾(OpenClaw)能干嘛的兄弟盟,建议直接去 fork 这个 GitHub! 作者整理了 30+ 个真实可落地案例,不是讲概念,是拿来就能跑的模板,普通人照着填内容都能用。 有哪些实用案例? - 自动汇总你最爱的 Reddit 板块精华 - 抓取 YouTube 频道最新视频并生成摘要 - 聚合 RSS / X / GitHub / 全网科技资讯 - 帮你做市场调研 - 甚至跑完整个游戏开发流程 最厉害的这个:Polymarket 自动驾驶仪 —— 在 Polymarket 上进行自动模拟交易,支持回测、策略分析、每日业绩报告。 跑完这些case,你就是龙虾大王了 🦞
中文
52
883
3.3K
277.5K