Janus

194 posts

Janus banner
Janus

Janus

@Janus00117

PhD Candidate, CS

Katılım Ekim 2022
45 Takip Edilen100 Takipçiler
Janus
Janus@Janus00117·
@TJ_Research 这种toC的业务让第一方oai或者anthropic来做完全是降维打击,toB的业务出于合规性和流程要求可能才是 $INTU 的机会.
中文
0
0
0
126
投资TALK君
投资TALK君@TJ_Research·
$INTU 个人(企业)退税这种事情,我认为未来一定会被个人/企业的AI AGENT做了,那么问题就是新的AI NATIVE公司做,还是 $INTU 能独占这个市场
中文
68
0
49
15.1K
Janus
Janus@Janus00117·
@LinQingV 目前只是科研阶段,等量产还要2-3年
中文
1
0
2
509
Macro_Lin | 市场观察员
Jukan的这篇文章里说,韩国存储厂已经在和GPU客户讨论把HBM从GPU封装里拆出来,用光互连桥接。核心原因是,堆叠层数往20层以上走,工艺难度指数级上升,横向多放HBM又被GPU的周长卡死。垂直和水平两个方向同时摸到物理边界,光互连成了剩下的选项。 这件事如果真正落地,对CPO供应链的拉动是巨大的。现在CPO的需求跟着交换机和光模块走,一个机柜一两个模块。但如果每颗高端GPU都需要多个光耦合点来连接HBM,需求量级直接跟着GPU出货量走,从网络设备级跳到芯片级,差好几个数量级。 这个场景里最有瓶颈的制造环节是光耦合对准。板级GPU-HBM光互连要求在极小空间里做亚微米级的激光光源、硅光波导、探测器之间的精密对齐,偏差几百纳米器件就报废。罗博特科收购的ficonTEC做的就是这件事,全自动主动对准加闭环计量,全球能做到这个精度和量产节拍的设备公司屈指可数。现在ficonTEC的订单主要来自CPO和OCS的产业化放量,但GPU-HBM光互连如果在2028年后起量,它的TAM会从光通信设备市场扩展到AI芯片封装市场。 时间节点上,这篇报道说的还是联合预研阶段,真正上量还有距离,从叙事到落地还需要时间。
Jukan@jukan05

Breaking the "Memory Wall": Optical Interconnects Emerge in GPU–HBM Packaging As a solution to the "memory wall," one of the chronic challenges in AI semiconductors, the memory and packaging industries at home and abroad are weighing an approach that decouples the GPU and high-bandwidth memory (HBM) and packages them separately. The core idea is to move the HBM—until now mounted right next to the GPU—a certain distance away, and bridge the gap with light (optics), allowing several times more HBM to be installed than is possible today. On the 22nd, a researcher at a major domestic memory maker said, "We're currently struggling to expand HBM bandwidth and capacity, so we're discussing with customers a plan to overcome the GPU's shoreline limit through optical interconnects and mount more HBM." Shoreline refers to the length of the chip's perimeter. In today's AI computing environment, the key factor dragging down compute efficiency is the data transfer speed of memory chips. While GPU performance has grown by leaps and bounds with each generation, the speed at which memory stores and supplies data has failed to keep pace—creating a structural performance barrier, the memory wall. The arrival of HBM, with its wide data pathways, put out the immediate fire, but critics continue to point out that bandwidth and transfer speeds still fall short of handling the explosive growth in AI compute. Until now, the industry has focused on stacking HBM ever higher to increase memory capacity and bandwidth within a confined footprint. But as stack counts climbed past 12 and 16 layers toward 20 and beyond, process difficulty rose exponentially. The technology hit physical limits, including the growing difficulty of meeting fixed height specifications. Vertical stacking has reached an inflection point—so much so that the JEDEC standards body has relaxed its HBM height specifications. The bigger problem is that if stack counts can't be raised, the alternative is to add more HBM horizontally around the GPU—but that, too, is impossible. In the current 2.5D packaging structure, the GPU and HBM are mounted tightly together on a single substrate. Within this structure, the number of HBM units that can be placed is strictly limited by the finite length of the GPU chip's perimeter—its shoreline. Even when more HBM is desired, there is physically no room to place it, leaving the industry in a structural deadlock. The alternative now emerging across the semiconductor industry is to separate the GPU and HBM and package them independently. It overturns the conventional chip-design principle that components must sit close together to minimize data transfer time. Instead of keeping the two chips adjacent, the approach spaces them apart and links them with overwhelmingly fast optical signals to overcome the added physical distance. Placing the HBM slightly away from the GPU within the board frees the design from the GPU's shoreline constraint. With the spatial limitation gone, far more HBM can be spread out laterally and packed into the board—several times more than today—without having to push stack heights to extremes. This means the total memory capacity and data bandwidth of the AI accelerator system would expand dramatically, on a scale incomparable to current systems. "Discussing Placing HBM Beneath the GPU"… Form Factor Could Change The industry is now producing a range of architectural design proposals over where exactly to place the HBM within the GPU board. The same memory researcher said, "Options under discussion range from broadly utilizing the space immediately around the GPU to isolating the HBM beneath the GPU board." He added, "In the latter case—isolating it beneath the GPU board—the motherboard would have to be extended lengthwise, so we're discussing even an overall form-factor change with the GPU maker." Specifically, the HBM might surround the GPU from several centimeters away, or a separate HBM zone might be created in the center of the board. "We're keeping every possibility open as we discuss the optimal layout," he said. "Nothing has been confirmed as an official roadmap yet, but as part of preliminary research toward next-generation AI accelerators, we're in talks with our partners." The outsourced semiconductor assembly and test (OSAT) industry is also watching this trend closely. An executive at a global OSAT firm said, "Optical interconnects are a clear trajectory. The only question is timing," predicting that "rack-to-rack and server-to-server links will go optical first, and then chip-to-chip connections within the board will follow." He added, "The larger units will be connected by light first, but optical research is moving so fast that it may not be that far off." Technically, the optical-interconnect technology linking GPU and HBM shares the same underlying principle as the technology connecting server to server inside a data center. The difference is the high technical barrier of shrinking optical-conversion technology—once used for communication between large pieces of equipment—down to the microscopic scale of a single board and chipset. An executive at a domestic developer of co-packaged optics (CPO) components explained, "As HBM stack heights approach their limit, the industry is discussing spreading the memory out laterally to maximize how much can physically be mounted." He added, "The principle is the same as conventional data-center optical interconnects, but HBM optical links that have to operate within a confined board space require optical components to be miniaturized to far smaller sizes and far higher integration density—so the technical difficulty is greater."

中文
42
37
247
48.4K
Janus
Janus@Janus00117·
@Balder13946731 哪家机构这么扯淡的分析,业务增长用最简单的logistic regression建模都不会这么扯淡😅
中文
0
0
0
132
Balder
Balder@Balder13946731·
目前有专家预测 Anthropic将在2028年产生高于 Google的总收入想并且2030年将拥有超过2万亿美元的收入。 再过几年Anthropic估计可以买下整个太阳系了吧。 但我觉得Anthropic的预估过于乐观,他们用的是3月份的总收入来预测全年收入,按照他们的算法,每个季度都会翻倍,今年的收入又增长1000%。 但是在ToB市场,收入其实是按照订单来算的,例如三月份Anthropic和Amazon和Google两家都签订了大订单,这些订单虽然推高了本季收入却不见得剩下的三个季度都有,当然到了明年,他们许多续订的可能性很大。 所以Anthropic超快速增长是真的,但是无限爆炸增长是不可能的。
Balder tweet media
中文
19
4
44
10.4K
Janus
Janus@Janus00117·
@tychozzz 现在投robotic就像15年投ads, 不是不看好, 时候未到.
中文
0
0
0
1.2K
Nico投资有道
Nico投资有道@tychozzz·
这次英伟达财报会议上,黄仁勋提到一句话,The next wave is physical AI AI 的下一波浪潮,将是物理 AI。未来会有数十亿个自动驾驶、自动化设备和机器人系统,在真实物理世界里运行。 其实大家都可以感觉到,现在 AI 在现实世界的存在感太弱了,最主要的表现形式仍然是生成文字图片视频、写代码、做办公自动化,这些主要发生在数字世界。 这一阶段的 AI 是理解语言、图像、视频,而下一阶段自然是 AI 理解物理环境,在真实世界执行任务,数字 AI 的能力必然会发生外溢。 而且目前全球劳动力结构需要自动化,很多国家面临老龄化、劳动力短缺的问题,最好的解决方案一定是机器人,Physical AI 的商业需求是非常现实的。 摩根士丹利预测人形机器人的市场,到 2050 年的时候可能超过 5 万亿美元,规模非常庞大。两大全球科技巨头 CEO 黄仁勋和马斯克,也都已经提前布局这一赛道,押注下一波机器人浪潮。 不过,目前美股市场上并没有独立的人形机器人上市公司,最值得投资的两家公司就是英伟达和特斯拉了,其次就是投资一些机器人相关的板块 ETF。 我自己从去年下半年开始,就一直在定投 BOTZ 这支 ETF,长期看好。 人形机器人现在市场还很小,买入的其实是一个长期看涨期权,当它真正落地成为可规模化劳动力的时候,市值一定会在万亿美元级别。
中文
76
38
168
30.5K
Janus
Janus@Janus00117·
@Balder13946731 $NVDA 完全能给到成长股的估值, pe给到40都没问题.
中文
0
0
0
280
Balder
Balder@Balder13946731·
$NVDA 是我的主力持股,而且我永远不会卖出。因为他的增速太惊人了,今年和去年同比增长82%,大股票里根本没有这样的增速,而且依然是供不应求,总收入今年预期就全美第一了。赚了钱也不用投入Capex,就直接回购。 所以在M7里现在是什么情况呢?经过一年的暴增, $NVDA 的股价完全跟不上其扩张的速度。他现在Forward PE是M7最低的,而且PE要比 $GOOG $AAPL $AMZN 等等都要低,只有 $META $MSFT更低。他们是什么增速?10%-20%的增速,所以和 $NVDA 比他们甚至都是有严重的泡沫,更无情的是, $NVDA 现在分红和回购都是更高的,就是两个字,无敌。 所以一直持有和任何时候加仓 $NVDA 都是没有问题的,因为本质上他是最便宜的股票,他前几年超高估值的泡沫,被他变态的增长硬生生都给挤掉了。 自己去查查接近三位数的增长,哪一个不是上百倍的PE?除了存储百分之几百的增速,其他都是梦市率。 考虑增速、热门板块、实际盈利能力, $NVDA 既是热门股、也是低估股;既是成长股也是价值股;既是动能股也是分红股。
Balder tweet media
中文
41
11
131
27.3K
Janus
Janus@Janus00117·
@tig88411109 要我说nvda的cpu可能是下一个指数增长点,arm 高通这种公司是真不想投。
中文
3
0
1
1.4K
Tigris 会讲课教授是好老师
市场独家深度,你看到了什么,你没有看到什么? $NVDA 人和人最大的距离,就在于对于一个股票价值的“认知差” 一念天堂,一念地狱。如果说Agentic AI 元年,市场已经买过很多东西了。 CPU/HBM /存储/光模块/NeoCloud 买过了,电力和数据中心也买过了。 最后剩下的,不是一个没人发现的小票。恰恰是那个所有人都以为已经太大、太贵、太拥挤的公司。
Tigris 会讲课教授是好老师@tig88411109

x.com/i/article/2057…

中文
45
14
104
53.6K
Janus
Janus@Janus00117·
@Balder13946731 永远尊敬程序员, 开发ai先革自己的命.
中文
0
0
2
223
Balder
Balder@Balder13946731·
今年以来科技大厂的裁员数量大约为10万。 这些支出都会变成Anthropic 或者 OpenAI的收入。假设每个人原本的支出是30万美元(因为公司不仅要支付薪酬,还有各种其他的费用),然后其中一半用于购买tokens。 那么迄今为止的裁员就会预计产生150亿美元的收入。而且这是每年的支出。如果我们预计今年开始到2030年,IT行业的雇员人数缩减一半,那么这个年收入就会飙升到1000亿美元。 • Oracle 30,000 • Amazon 16,000 • Meta 8,000 • Block 4,000 • Cisco 4,000 • Intuit 3,000 • WiseTech 2,000 • Atlassian 1,600 • Snap 1,000 • Ocado 1,000 • Livspace 1,000 • Autodesk 1,000 • eBay 800 • Coinbase 700 • Pinterest 700 • Playtika 500 • Workday 400
中文
11
5
70
16.1K
李志 | Rational Investing
李志 | Rational Investing@LZRationalnvest·
谷歌给我发邮件了,Gemini 应用从此之后,开始有用量限额限制了,限额每 5 小时刷新一次,直至达到每周限额。作为 Pro 订阅用户,享有的用量限额是非订阅用户的 4 倍。
李志 | Rational Investing tweet media
中文
19
1
34
24.7K
Janus
Janus@Janus00117·
@python_xxt 如果是炒美股亏钱那是得反思一下是不是自己的问题了🥴.
中文
0
0
0
109
摩卡星冰乐
摩卡星冰乐@Franktradinglog·
我不认为今天以及明天会是抄底的好时机。既然long semi short saas的hf在这个时候开始做unwind,他们几乎没有任何理由在英伟达财报之前买回。 smh和大盘的低点应该出现在周三或者周四。英伟达财报反应好,就是周三,反应不好,那就是周四。
中文
9
12
134
27K
Janus
Janus@Janus00117·
@LVTGW666 你兄弟知道啥叫杠杆吗🥴
中文
0
0
0
442
利维坦冲浪里
利维坦冲浪里@LVTGW666·
如果我兄弟平子上次听见通缩,说通缩不是好事吗,老百姓买东西不就更便宜了吗的情况下,这次平子听见社融结构性崩塌,企业和个人都不借钱,我兄弟估计就会说,这是好事啊,说明大家伙都有钱且理性了,不会盲目加杠杆,也没有上杠杆的需要了
中文
29
7
203
18.8K
Janus
Janus@Janus00117·
@LZRationalnvest 相比看女人打架我更爱看亿万富翁打架🤭
中文
0
0
0
1.6K
李志 | Rational Investing
李志 | Rational Investing@LZRationalnvest·
华尔街日报曝光了马斯克和奥特曼关于OpenAI的官司的更多细节和劲爆的证据。 细节一:马斯克在会议室里大发雷霆、砸画摔门,布罗克曼以为自己要被打了 2017年,马斯克要求获得 OpenAI 51% 以上控制权遭拒,当场情绪失控。布罗克曼在证人席上回忆,马斯克绕着会议桌狂走,随后抄起一幅挂画甩门而出: "我真以为他要打我,真的以为他要动手。然后他一把抓起那幅画,气冲冲地走了。" 细节二:马斯克曾想独揽 OpenAI 控制权,想要百年后传给自己的孩子 奥特曼当庭透露,马斯克曾要求对 OpenAI 拥有绝对控制权。当有人追问他:万一你去世了,公司怎么办?马斯克说:"我还没仔细考虑过,但或许 OpenAI 的控制权应该传给我的孩子。" 细节三:奥特曼被董事会赶下台当晚,在门外狂发短信求进入会议室 2023年底,OpenAI 董事会突然宣布解雇奥特曼。就在董事会开会决定其命运的那个深夜,奥特曼在门外不停给米拉·穆拉蒂(OpenAI首席技术官)发短信打探消息,穆拉蒂回复:"他们不希望你进来。今晚想任命一位新CEO,新来的是个随机的 Twitch 主播。" 细节四:OpenAI差点和 Anthropic 合并 奥特曼被解雇的混乱期间,OpenAI 董事会私下与 Anthropic会面,讨论由 Anthropic 合并并接管 OpenAI 领导权的方案。伊利亚·苏茨克维尔(OpenAI联合创始人、前首席科学家)在庭上确认了这一经历。 细节五:马斯克指控奥特曼把非营利机构变成摇钱树,整场作证重复了17遍 OpenAI 最初是一家以造福人类为使命的非营利机构。马斯克指控,萨姆·奥特曼和格雷格·布罗克曼将这家非营利机构的资产和技术,私自转移到了自己持有大量股权的营利性公司,从中套现数百亿美元,本质上就是把捐款人的钱装进了自己口袋。 马斯克在整场庭审作证中,把"窃取慈善机构的钱财是不对的"这句话重复了整整17遍。
李志 | Rational Investing tweet media
中文
165
68
550
285.3K
Tigris 会讲课教授是好老师
听说是这个PPT引发的今天存储踩踏? 这种前三星半导体退休二线韩国欧巴的会议演讲,目标群众和内容不说是过时信息,也是认真“扯淡”的水准。 什么中国威胁论,存储27年就价格跌,如果云大厂Capex投入不及预期那么28年就存储过剩 这都是行业演讲没什么仔细测算… 更谈不上对刚刚发生的Agentic AI元年巨大指数型需求的认知,PPT写的时候,全市场还没有意识到自主执行的AI的巨大需求范式变化 当然一个会议小作文报道就能引发存储的大跌,也正证明了前期这段时间半导体硬件赛道的拥挤,有人出有人进,各道一声SB 正如我周报昨天预测一样,如果鉴别是真摔还是假摔,具体见订阅者分享。 一句话:我的周报题目 “不畏浮云遮望眼” 站的高,仓位好,才能看穿资本市场的恐惧和贪婪
Tigris 会讲课教授是好老师 tweet media
中文
7
8
57
26.7K
Severus
Severus@Asuka_Tokugawa·
这就是目前主流国家的资本利得税,澳洲基本上是全世界最高。 在澳洲炒股,盈利的4成要交给澳洲政府,这就是现状😔 🇳🇿 NZ: 0% 🇸🇬 Singapore: 0%  🇦🇪 UAE/Dubai: 0% 🇯🇵 Japan: 20% 🇨🇦 Canada: 27% max 🇬🇧 UK: 20% – 24% max 🇺🇸 US: 20% max 🇮🇱 Israel: 25% (Standard) 🇦🇺 Australia: 30% - 47% ⁉️
中文
68
41
242
73.8K
Janus
Janus@Janus00117·
@bboczeng 老登就适合买老登股
中文
0
0
0
276
勃勃OC
勃勃OC@bboczeng·
想不到,段永平的水平居然这么低 他真的没用过Claude? 甚至GPT CodeX 脑子里只有Gemini这个难用到我都退订的东西? 😓😓😓
中文
50
3
79
26.7K
Janus
Janus@Janus00117·
@python_xxt gpt 5.5 thinking heavy感觉也差不多,但是要pro还能用,open ai这波操作很迷。
中文
0
0
1
3.4K
Robinson · 鲁棒逊
Robinson · 鲁棒逊@python_xxt·
虽然Codex很强,很好用,但我想说: 大家还是要多和 Opus 4.7 聊聊天, 思考的深度,完全不一样。 Opus 4.7,依然是我们大众,可以调用的最强模型
中文
141
7
311
135.5K
Herman Jin
Herman Jin@ShanghaoJin·
一个市场,当你发现你关注的币圈KOL们都在煞有其事地研究的时候,不是3am也至少1:30am了
中文
73
9
204
99.9K
Janus
Janus@Janus00117·
@bboczeng 金融逼做个报表闹麻了
中文
0
0
5
298
勃勃OC
勃勃OC@bboczeng·
Ken Griffin警告称,Agentic AI(代理型人工智能)正在把原本需要数月才能完成的顶级金融工作,压缩到几小时内自动完成。
中文
7
2
38
8.1K