大捕手
147 posts






论文里更多的思考: AI算力集群大量消耗电力,而且其中80%的电力和70%的成本并没有用于计算,而是被“Data Move”和数据的“Load/Save”消耗掉了 。 为了在宏观尺度压缩这些开销,华为在论文里面提到了三样东西: 1,Unified Bus(统一总线):这个我们之前好好地聊过,UB放弃了传统的复杂堆叠协议(PCIe, NVLink, 以太网等),采用内存语义的底层直接互联。这让端到端的远程访问延迟从数十微秒骤降至约100ns(指数级缩减),在多机柜甚至机房的规模上实现了“系统即芯片” 。 2,Hi-ONE(近封装光引擎):这种光学I/O单模块可提供8 Tb/s的带宽,将传统电SerDes的传输距离需求从100厘米骤降到约5厘米,同时将机柜间的互联距离扩展到100米,在物理层面保障了高密度计算 。 3,3D Folding:传统意义上的2.5D封装中,算力随芯片大小增长,但也受限于芯片大小。还记得之前的Cowos-S和给GB300用的Cowos-L? 华为的3D Folding强行将供电(背面供电网络),高速内存和光I/O从芯片的“边缘”转移到了垂直“表面”,这就有点意思了,大家都具备了3D的扩张能力,可以彻底让带宽与算力实现了同频共振 。。。

翻译一下,Kimi 自己基于 Python 写的 kimi-cli,在今天换成了基于 Typescript 和 pi-tui 写的新 kimi-code。 已经在 PUA 对应的研发小哥哥加一些我在 Claude Code 上用得很爽的功能。🤡🤡🤡






发表个暴论,TUI 会逐渐式微甚至被淘汰。 我已经很久没有用 claude code 了。基本都是用 slock。 对于临时任务,现在用的更多的是 codex desktop,偶尔用 claude desktop。 让我开始重新思考 TUI 这个东西。 今天 slock 群刚好在讨论 TUI,大家对 TUI 的评价基本一致:方向就是错的。有人说"TUI 错的离谱",有人说"所有 TUI 都是被 claude code 整个带偏了方向"。这话说得有点重,但细想确实有道理。 @OnlyXuanwo xuanwogg 在群里分析 TUI 为什么会流行?觉得主要是历史原因。早期模型写不动 GUI,TUI 实现简单,模型能生成,claude code 就从这里起步了。然后大家跟风,一时间 TUI 变成了 AI 编程工具的"标准姿势"。但这只是路径依赖,不代表正确。 历史是曲折上升的,claude code 起步时没人知道交互该怎么做,TUI 作为起点有其合理性。但现在模型能力强了,继续用 TUI 就说不过去了。 TUI 不是没有优点——可以 SSH 登录从任何地方访问,本地应用架构也更干净。但这些优点在 AI agent 场景下根本撑不起来。长时间运行的任务、复杂的上下文、需要可视化展示的过程,TUI 的体验是真的差。本质上它是"裂化的 GUI"——有 GUI 不用,硬要退化成 TUI。 那什么才是对的方向?讨论里的共识是两条路: 一是 CLI + server 架构:命令行作为触发器,真正的逻辑和状态跑在 server 端,前端可以是任何界面。这样既保留了 CLI 的灵活,又不被 TUI 的体验拖累。 二是直接上 Web UI:模型现在完全写得动,没有理由还停在 TUI。 对我来说,换成 codex desktop 之后,任务状态一目了然,不用再跟终端界面搏斗。这才是 AI 工具应该有的样子。 模型的能力在进化,工具的交互方式也应该跟着进化。还在用 TUI,是在用现在的模型干以前模型才干的事。












