C菌
925 posts


买特斯拉赠MacStudio? 特斯拉 AI5 芯片流片成功了!
马斯克之前就宣布要搞特斯拉AI芯片, 就在刚刚发x庆祝特斯拉 AI5 芯片流片成功, 这个AI5芯片参数是这样的:
直接来看最重要的内存带宽, 可以看到片上集成了12个SK海力士的LPDDR5x颗粒, 总容量来到了144GB, 我们如果按照7500 MT/s 到 9600 MT/s的速率来算, 那么带宽大概会介于 819.2 GB/s - 921.6 GB/s 正好差不多是 MacStudio M2 Ultra 的内存带宽 (800GB/s), 也就是说只要买了搭载 AI5 芯片的特斯拉, 就相当于赠了个 MacStudio!
这个速率如果运行 Qwen3.5-27B 或者 Gemma4-31B 的 8bit 量化, 输出速度大概是 30-34 token/s. 可以一用了. 想象一下车到家放车库里还能远程连上自己用或者算力并网直接卖算力.
另外这个芯片是针对目前大模型中最核心的 SoftMax 函数进行了原生硬件级优化的, 在上一代 AI4 中, SoftMax 算法需要在模拟模式下分 40 步执行, 而在 AI5 芯片上可以单步(1 step)原生执行, 极大地打破了计算瓶颈. 另外芯片内置了混合精度张量加速器, 针对 INT8、INT4 甚至 INT2 等低精度整型运算进行了优化, 同时也支持 FP8 运算. 这意味着跑量化模型还能更快.
至于算力, 官方说 INT8 性能大概是 2000 TOPS, 作为对比 NVIDIA RTX Pro 6000 Blackwell 大概是 3,341 TOPS. 而 Mac Studio 大概只有 100TOPS (8bit精度上simd_dot指令). 所以甚至性能比Mac Studio 强很多. 当然这个性能还不足以从0炼大模型哈, 这个更适合用来推理, 或者进行小范围的微调. (炼不到1B的电子鹦鹉是可以的)
当然这个芯片最初的本意其实是给完全自动驾驶(FSD), Robotaxi(无人机出租车网络), Optimus 人形机器人这些设备应用端到端大模型准备的, 特斯拉从 FSD v12 版本开始, 自动驾驶已经完全转向了端到端神经网络, 所以智驾搭配端到端大模型已经是板上钉钉的了.
现在恐怕唯一的问题是, 如果车不能插网线而且停得比较远连不上, 是不是还要单独买流量包才能连自己的车...
#tesla #teslaai5 #musk #马斯克
x.com/elonmusk/statu…


中文















