MHQuant
605 posts

MHQuant
@AvaMhquant
#Crypto #Quantitative trading #INTP




芯片只有AI火热,半导体的2024年基本延续了2023这个基调 只要蹭上AI相关的叙事,股价增长表现都是接近翻倍或者更高,毕竟这是确定性的增长机会,PE都会给的很有想象力 蹭AI失败典型就是高通,微软的recall功能跳票,导致AIPC/端侧LLM叙事直接破产,股价高点下跌不少,就算赢了跟ARM的官司也无济于事 微软跳票+苹果apple intelligence乏力+安卓碎片化,今年端侧AI/LLM只能这么评价:存在感基本为零 端侧LLM功能开发是heavy lifting,即便端侧算力完全达标了(手机端NPU算力去年已经75TOPs了,非常暴力,标准的桌面级,两年内到150Tops问题不大),端侧LLM生态也还没有那么快,还需要SDE们的持续爆肝。我还是和一年前观点类似,看好26~27年才会有比较显著的进展和丰富一些的玩法 端侧AI目前唯一的热点就是智能眼镜,Meta的Rayban眼镜只是个原型,AI功能实用性基本可以忽略,也卖了两百万,整个智能眼镜市场全年接近四百万销量,风头超出了所有人的预期,PMF得到了验证 虽然目前的智能AI眼镜跟LLM半点关系都没有。24~25年主要的端侧AI部分就是眼球追踪和手势追踪,顶多加上OCR,毕竟眼镜只有那么一点点算力,功耗要求也过于严格(<1w)比手机低了一个数量级 下周的CES在端侧AI基本上就是AI眼镜主题秀,说百镜大战可能有点夸张,但差不多就是这个热度,是典型的Hype没错,但未来可期也是真的 -------------------------------------------- 另一个蹭AI失败的Micron,则是因为PC和手机端的DRAM需求比预期疲软,股价涨了一阵跌回原地。毕竟PC和手机端内存是大头,HBM的占比暂时还是太低了,难以撑起AI叙事,7倍的forward PE低的令人发指 AMD是个例外,蹭上了AI竟然还是跌的,2025的PE也低到竟然只有17。各家CSP都热衷于自研model->compiler->asic accelerator从上到下一整套解决方案提高performance,ASIC赛道的火热,让AMD和Nvidia在同一个赛道火拼,只能说CUDA积累的生态优势恐怖如斯 ------------------------------ 蹭AI姿势最成功的,莫过于给各家互联网云厂CSP们做ASIC AI加速器的Broadcom和Marvell,都是直接靠画饼就能翻倍,太可怕了(以及即将蹭上的MTK/AICHIP) 这大概是2024年最大的的芯片风口转型故事 其实帮互联网公司做ASIC AI加速器对于传统半导体厂商并不是特别有挑战性的事情,对IP的要求并不高,主要是做SoC的infra从前端到后端整个配套设施,核心core ML加速器+上层compiler都是互联网公司自己做。 只要服务态度好,客户支持到位,要求什么就给什么,价格合理,门槛并不是那么高。除了互联interconnect IP,基本上可替代性比较高 所以MTK这种云端NPU经验并不多的芯片厂,也能当Google TPU V7之一的供应商 大公司deploy自己的model时,现在都喜欢用自己的asic配套自己的compiler,自己做的asic明明在纸面功耗比上(TOPs per watt)比H100差了不少,甚至能到40%,要花大力气用自家的功耗比并不是那么好的asic,表面上来看并不合算,除了控制成本(和NV讨价还价),为什么还要自己做? 简单的说,各种深度学习model/workload的瓶颈都不一样,很难有通用的解法,卖家标称的纸面性能/功耗比,并不能代表实际日常的实际表现 公司即便是把H100拿过来用,不经调试直接跑自己的model,其实根本跑不到Nvidia标称的性能performance,差距非常明显 如果要跑出理想的performance,要去研究model怎么适配CUDA做优化,甚至需要改compiler里面的一些参数,所以即便是Nvidia,也会派人给大客户针对他们的workload去optimize/tune CUDA/compiler层 而如果大公司比如meta用自家的model/compiler和hw全套,特定的workload会比其他家的ASIC比如高通的AI100 性能要高数倍 因为自家的模型运算细节自己都了解,可以针对自己的model改compiler和芯片,model的size等各种参数达到最好的效果,从内存分配逻辑,kernel tuning,数据精度,tiling,流水线pipeline结构去从硬件的角度迎合上层model的优化,性能差距会非常大,这是一个上层应用决定硬件形状的时代 如果meta用高通的SDK+compiler+ASIC全套,没有办法针对自己的model去优化,只能用高通的东西去sweep各种参数,这里说的sweep意思是高通的SDK和编译器允许用户调整一些参数(例如线程块大小、内存分配策略、流水线深度等)来优化特定operator的性能。用户会尝试不同参数组合,以找到性能的sweet spot 而sweep参数获得的性能优化会比较有限 这就是为什么最后大公司比如meta的model运行在高通的asic上面的performance,反而会不如自己家看起来功耗比更差的全套compiler+ASIC ----------- 为啥CSP们要自己做芯片的同时又外包给传统半导体厂商呢? 一块SoC里大部分IP,包括Cache/memory,CPU,DSP,high speed IO, boot以及低功耗控制,需要的人力是很多的,但只是提供了一个承载ML加速器运行的infra平台,对于互联网厂家来说没有任何自己做的必要,CSP们只会对直接影响ML加速器部分的内容感兴趣 芯片这个圈子太小了,而且前端后端各个角色之间隔行如隔山,挖人不容易,无法在短时间内招到一个磨合良好的团队稳定的迭代项目。Goole/Amazon/Microsoft/Meta这几家开出高出市场价很多的薪水四处挖角,silicon team也都只是几百人到一千人的规模。一般来说从零开始组建一个不错的大厂silicon design house成型,起码要十年时间 所以给成熟的芯片大厂外包做是一个很合理的选择 ------------- 那么CSP们会不会自己做了ASIC然后往外卖和Nvidia竞争呢? 不会,因为这些ASIC组成立的目标KPI就是节约了多少成本,专门做这个生意风险和投入不成正比,芯片支持多个客户的成本是上升很多的,完全没有必要 这也是为什么这些ASIC组在制定架构指标时比较省心,直接对标Nvidia下一代的Tops以及带宽指标就行,同算力功耗多了50%也无所谓,靠后期compiler和针对性架构来弥补,反正只要能节省成本不被Nvidia压榨就行 ----------------------------- ASIC AI加速器故事即便在2025~2026年,其实也还是整个市场占比很小的小众市场,Nvidia仍然是这场LLM科技革命里毫无疑问的基建期唯一大boss 至于openAI/Anthropic能不能像2004年的Google/Facebook一样,成长为这一轮浪潮里的新巨头,那就拭目以待了 2025年的半导体,AI作为主旋律的日子,怕是还会持续。不过其他领域的复苏,比如汽车电子的增长,还是比2024要好看些的 2025除了AI主旋律外最大的看点,就是intel的18A制程量产效果能否如期落地,这可能是2025影响产业格局最大的事件了



深度解析!中国的经济到底好不好? 先给兄弟们科普一下:于钱是怎么产生的,前面已经说过,主要通过三种途径: 一是“印”钱,即各国中央银行印钞厂物理意义上“印刷”货币; 二是“借”钱,银行借贷加杠杆创造的“派生货币”; 三是“造”钱,通过量化宽松政策“大放水”产生的货币。 中央银行的货币发行,是通过再贴现、贷款、购买证券、收购黄金、外汇等投入市场从而形成流通中的基础货币。 统计局可能是这半年最努力的部门了,半年数据出炉,看上去宏观经济和社融数据都挺不错的,市场基本形成共识,三季度不会有刺激政策。 真的这么好么? 现在我们看下目前整体经济的情况: 01、先看宏观经济数据: GDP:上半年国内生产总值同比增长5.3%。其中一季度同比增长5.4%,二季度同比增长5.2%,下降。 规模以上工业增加值:上半年全国规模以上工业增加值同比增长6.4%。其中6月同比增长6.8%,5月同比增长5.8%,增长。 固定资产投资:上半年全国固定资产投资(不含农户)同比增长2.8%。其中6月当月同比-0.1%,5月同比2.7%,下降。 社会消费品零售总额:上半年社会消费品零售总额同比增长5%。其中6月同比增长4.8%,5月同比增长6.4%,下降。 基建投资(不含电力):上半年基础设施投资(不含电力、热力、燃气及水生产和供应业)同比增长4.6%。其中6月当月同比2.0%,5月同比5.1%,下降。 房地产开发投资:暂无公开的上半年整体同比数据,但从1-6月单月数据来看,房地产开发投资持续同比下滑,6月同比-12.9%,5月同比-12.0%,下降。 房地产销售面积:暂无公开的上半年整体同比数据,6月同比-5.5%,5月同比-3.3%,下降。 房地产销售金额:暂无公开的上半年整体同比数据,6月同比-10.8%,5月同比-6.0%,下降。 制造业投资:上半年制造业投资同比增长7.5%。6月当月同比5.1%,5月同比7.8%,下降。 进出口(以美元计):上半年货物贸易进出口同比增长2.9%。其中出口增长7.2%,进口下降2.7%。6月出口同比5.8%,5月同比4.8%;6月进口同比1.1%,5月同比-3.4%,增长。 GDP三驾马车,仍靠投资端,也就是供给端撑着,资金来源全靠政府债;出口暂时稳住,主因关税暂缓,抢出口效应填充;内需不足,以旧换新稍微一停社消就咣咣猛跌。 先说供给侧的问题: 疫情之后,规模以上工业增加值保持较高增长,但是PPI持续下跌,实际上,PPI已经连续下跌33个月。 6月份,规模以上工业增加值同比增长6.8%,涨幅扩大1个百分点;PPI同比下跌3.6%,跌幅扩大0.3个百分点;二者偏离度进一步扩大到超10个百分点。 PPI的持续下跌,代表中上游的产能过剩。 其次是需求侧的问题: 这里要专门说一下社消的细分数据,非常的反常识,6月,商品零售和餐饮收入同比分别为5.3%和0.9%,较上月下降1.2和5.0个百分点; 限额以上零售中,通讯器材、家电音像器材、家具、文化办公同比分别为13.9%、32.4%、28.7%、24.4%,较上月变动-19.1、-20.6、3.1、-6.1个百分点。 限额以上零售中,烟酒和饮料类零售同比分别下降0.7%和4.4%,较上月下降11.9和4.5个百分点。 我是不明白到底是哪个群体,连饭都吃不上了,反而在拼命买家具、家电、手机和平板。 更诡异的是,6月份社会零售同比增长4.8%,但CPI同比增速只有0.1%,通常来说,消费强劲,意味着需求强劲,会导致通胀上升。 但是,从上半年量价背离的表现可以看出,当前市场需求依然低迷,产能依然过剩,仍处于以价换量的艰难的出清周期。 我看不懂,更无法理解。 总结一下:经济总量增长放缓,供给侧产能过剩,内需不足,钱没少印,但物价低迷,说明钱没有进入实体经济内。 02、再看金融数据: M2:暂无公开的上半年整体同比数据,6月同比8.3%,5月同比7.9%,增长。 社融:暂无公开的上半年整体同比数据,6月同比8.9%,5月同比8.7%,增长。 CPI:上半年全国居民消费价格指数(CPI)同比下降0.1%。其中6月同比0.1%,5月同比-0.1%,增长。 PPI:6月全国PPI同比-3.6%,5月同比-3.3%,下降。 今年整个半年,社融不塌方全都靠政府债撑着。 作为市场主体的企业和居民贷款,均没什么提升,1-6月新增居民贷款呈逐年下降之势,居民部门信心缺失。 唯一的亮点是企业短期贷款,原因不明。 最最重要的是,放出来的钱并没有到居民手上,居民贷款余额占社融比例不断下降,已经降至19.52%,连续21个月下滑,并且连续5个月低于20%。 钱去哪里了?其实,社会融资中60%以上都是政府和国有企业融资,然后就是大型制造企业贷款。换言之,每年高增长的货币更多流入政府端和投资领域,更少流入居民端和消费领域。 更少的资本流入居民端,无法提振消费,更多的资本流入政府端和国有企业,政府部门在缺乏市场机制调节作用下集中投资,央国企控制的上游煤炭、钢铁、水泥等产能普遍过剩,导致价格持续下跌、通缩长期化。 而存款,今年6月当月,居民存款和企业存款分别新新增2.47万亿和1.78万亿,同比分别多增0.33万亿和0.78万亿。 居民户新增存款2.47亿元是很夸张的,前6月累计新增存款达到10.77万亿元;而新增贷款仅5976亿元。结合过往数据测算,前6月居民存贷比为9.21。 这代表了居民一方面贷不到款,一方面又拼命存款,这是一种典型的收缩表现,当然,更有可能是资金的分配问题,这里不方便展开说了。 总体而言,社融的结构是“政府强、居民弱”“存款强、信贷弱”“短贷强、长贷弱”的结构性特点。 03、最后,看财政数据: 不同于经济和金融数据,财政收入从去年开始,就一直是负增长,一般来说,GDP与收入大致是同向的,并且长期以来,中国GDP增速与税收收入增速是一致的,从2010年到2018年三季度,二者平均的偏离度只有2个百分点左右。 但是,从2018年四季度开始,二者平均偏离度开始扩大到9个百分点左右。 今年上半年,实际GDP同比增速为5.3%,(1-5月)税收收入同比下降1.6%,二者偏离度达到夸张的6.9个百分点。 财政收入降低,说明一个问题,在经济总量维持不变的情况下,经济活动产生的利润变低了,也就是说,经济的效率变差了。 我们分别从宏观经济,金融数据,财政三个方面来分析了经济现状,结论是经济总量尚可,但结构问题很大,供给侧钱太多,导致产能过剩,需求侧居民端内需不足,这带来的后果是经济效率的降低。

























