ne-hayak
2.6K posts


Moonshot AI创始人杨植麟最近放出了一个40分钟视频。
这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2的整个训练过程。
他们只花了460万美元。
上周一场8模型实时编程大战,Kimi K2直接拿下第一,GPT-5.5排第三,Claude Opus 4.7第五。
我看完后最大的感受是,AI竞赛的规则已经在悄然改变。
所有人还在拼谁敢烧更多钱、堆更多算力,他却用极致优化、线性注意力、子代理这些硬核架构,把资源差距直接抹平甚至反超。
40分钟全是干货,零废话,把关键打法讲得清清楚楚。
如果你正在做AI代理,或者准备2026年入场大模型赛道,这段视频强烈建议存下来周末慢慢看。
小团队靠聪明架构,正在把大厂的传统玩法一点点颠覆。
你还觉得只有堆钱才能赢吗?
中文

@sukie234 这玩意儿自己公司或者朋友用没问题,一旦面向消费者如何建立信任是最大最难的问题
中文

运营中转站这段时间是真没赚到钱,只能说勉强cover了我自己用ai的消费。
所以目前打算把开中转站的一切全部开源,包含如何建站+营销,门槛最低,让这个行业更卷一点。
首先整个系统由3个部分组成:
• 第CN2 回国专线服务器:放在海外但回国速度极快的 VPS,作为运行核心。
• sub2api:核心程序,负责把网页账号转成 API 接口。
• Cloudflare:把流量再绕一道,提升国内访问速度,同时隐藏真实服务器 IP。
你需要准备:
• 一台 CN2 GIA 或 CN2 GT 线路的海外 VPS(推荐配置:2 核 CPU、2GB 内存、20GB 硬盘以上)。
普通海外 VPS 在国内晚高峰几乎不可用,而 CN2 GIA 通过专线绕开了拥堵的公网节点,国内访问延迟一般在 150ms 以内。如果你买了不是 CN2 的服务器,国内用户体验会非常糟糕。
• 一个域名(建议在 Cloudflare 或 Namecheap 上购买,便宜的 .top 或 .xyz 也行,几块钱一年)。
• 一个 Cloudflare 账号(免费)。
• 号池:初期可以用 claude code pro 账户+ 注册大量gpt账户,货比三家去找到别的号商卡商,等后期你就可以搞claude code max kiro 反代 aws bedrock(去跟sales聊,基本能搞到7.2折),但是初期只需要保障claude code pro账号稳定即可,因为你需要养号,后期转max。
完整请求路径如下:
国内用户的客户端 → 解析到 Cloudflare 的 IP → Cloudflare 边缘节点 → CN2 专线回源到你的服务器 → 宝塔面板的 Nginx 反向代理 → sub2api 程序 → 你的号池 → ChatGPT 或 Claude 网页 → 数据原路返回。
购买并初始化CN2服务商
CN2 GIA 线路的常见服务商有 BandwagonHost(搬瓦工)、RackNerd、CloudCone、Lisahost。新手推荐搬瓦工的 CN2 GIA-E 套餐,稳定但价格略贵。预算紧的可以看 Lisahost 的香港 CN2 套餐。
如果你懂命令行搭建Nginx,手动部署SSL证书,那你就自己搞,如果你不懂可以使用中国程序员流行的宝塔面板,一键搭建Nginx、一键部署SSL证书、可视化配置反向代理,全程鼠标点击操作,新手也能轻松上手。
安装完Linux + Nginx + MySQL + PHP,就可以开始设置防火墙,够买域名,添加DNS解析。
最后去命令行输入ping.api.你购买的域名,返回服务器ip就行了。
搭建sub2api:
sub2api 是一个开源项目,可以把 ChatGPT 网页版、Claude 网页版的 cookie 或者 session 转换成 OpenAI 兼容的 API 接口。
打开sub2api的官方教程,安装流程安装docker,拉取并启动sub2api的容器。
你需要把号池数据放到 /www/sub2api/data 目录下,sub2api 容器会读取这个目录。具体格式参考 sub2api 项目文档。
设置Nginx反向代理
添加完之后目标url是127.0.0.1:8080因为 sub2api 容器监听的就是这个地址。Nginx 收到外部请求后,转给本机的 8080 端口,sub2api 处理完返回给 Nginx,Nginx 再发回给用户。
后面你去问claude code 如何优化Nginx的配置,AI API 调用是流式响应(SSE),需要长连接 + 不缓存才能正常工作。默认 Nginx 配置在这种场景下会出问题,按照claude的提示优化,proxy_buffering 必须关闭,如果不关闭这个,AI 的回答会"卡一阵 → 一次性吐出",而不是逐字流式输出。客户端会感觉非常慢甚至超时。
申请HTTPS证书:
OpenAI 兼容客户端基本只信任 HTTPS。HTTP 明文会暴露 API Key 给中间网络。
申请好Let's Encrypt证书之后,回到 SSL 主界面,把"强制 HTTPS"开关打开。
优化Cloudflare配置
测试HTTPS-开启cloudflare代理-Cloudflare SSL 模式必须设为 Full (strict)
AI API 是动态接口,Cloudflare 的某些"优化"会破坏流式响应。
Cloudflare → 你的域名 → 速度 → 优化。
全部关掉以下选项:
• Auto Minify(自动压缩 HTML/CSS/JS):关闭。
• Rocket Loader:关闭。
• Mirage:关闭。
• Polish:关闭。
设置缓存规则:
Cloudflare → 缓存 → 配置。
Caching Level 选 Bypass,或者保持 Standard 但是后面用页面规则覆盖。
更彻底的做法:Cloudflare → 规则 → 页面规则 → 创建页面规则。
URL 模式:api.example.com*
设置:Cache Level = Bypass
设置防火墙规
Cloudflare → 安全性 → WAF → 自定义规则 → 创建规则。
规则一:限制单个 IP 频率
字段:IP source address,操作:Rate limiting,每 10 秒最多 30 次请求,超出后挑战或屏蔽 1 小时。
规则二:屏蔽明显恶意爬虫
字段:User Agent,运算符:包含,值:python-requests
启用 Cloudflare Argo Smart Routing,每月 5 美元,能在 Cloudflare 内部用最优路径路由你的流量。对国内用户访问海外服务器有 30% 到 50% 的速度提升。预算够推荐开。
测试上线
用 curl 测试 API,或者打开 CherryStudio 或 ChatBox,填写你的api地址和key做测试
使用Prometheus/Grafana,或者直接用宝塔面板做监控,可以看到 CPU、内存、流量实时数据。如果 sub2api 容器经常吃满 CPU,考虑升级服务器配置。
中文

兄弟们,这个羊毛有人冲了吗?
Command Code AI 1美元/月 Go计划上线了!
只需 $1/月 + 处理费,就能用上顶级开源AI Coding Agent:
$10 Credits ≈ 15K次请求
$100 Taste-1 个性化学习额度(越用越懂你的编码风格)
DeepSeek V4 Pro 当前4倍使用(到5月底 ≈ $40价值!)
支持:Kimi K2.6、GLM-5、MiniMax、DeepSeek V4 Pro/Flash、Qwen 等顶级开源模型(非量化原版)
CLI一键安装:npm i -g command-code
避坑点:
好像普通邮箱不好注册,谷歌邮箱秒过;
这个手续费好像有点高,你们也是这情况吗?
传送门:commandcode.ai/pricing


中文


我觉得这次 @ManusAI 事件中最大的变量就是北京真的可以相对简单、相对优雅的叫停交易。
就像铜头皮带抽不到张爱玲头上一样,肖弘要是不回来、当局要是得威胁 Manus 团队家属或发布国际通缉令才能真正入局干涉的话任何条件都是可以谈判的,身段手法都会柔软很多。
但问题是肖弘和洪文一样都相信开会的由头就过去了,北京当局一下手里有了小王牌,自然随意拿捏。
Manus 不是深度求索、不是智谱、不是宁德时代,不是最高级别的国之重器,只是赶上了科技竞争进入国战时代,同时用它杀一儆百又格外简单。
推荐大家温习米指导23年的老视频——统战价值计算公式:
统战预期收益 = 你作为建设者的预期贡献 + 你作为敌人的预期破坏 + 消灭你的预期成本 - 为保持你的友善不得不向你输出的预期利益
youtube.com/watch?v=hJSOCb…
肖弘赴京显著降低了消灭他的预期成本。

YouTube

路人蝙@lurenbian
@lidangzzz 今天的世界似乎稍有重回上世纪五六十年代的迹象,有没有政治嗅觉就是蹲牛棚、写《一滴泪》和领诺贝尔物理学奖的区别。
中文

看到 小米MIMO 群都在讨论 Claude GPT,突然觉得有点好笑
为啥加了这个群?
纯属好奇申请了“百万亿Token激励计划”
申请的时候用的Gmail邮箱
小米账号很早注册了用的163邮箱
申请的通过了但是我邮箱不对版领不到
控制面板没有改邮箱的地方
我进群联系客服也没回应
咋整?

烁皓@eternityspring
我也申请点小米token试试。 看看小米到底是粗粮还是细糠!
中文























