头雁

4.8K posts

头雁 banner
头雁

头雁

@alacheng

AI & Crypto 投资/技术 研究分享 AI / ZK /ZKVM / FHE / MPC / L1 Researcher

Katılım Mart 2011
3.4K Takip Edilen22K Takipçiler
Sabitlenmiş Tweet
头雁
头雁@alacheng·
BTC考古,这是一个google的工程师,当年和中本聪在邮件列表中沟通的邮件。当时中本聪还有个功能没有实现,原话翻译的是 “该协议有一个未完成的部分,涉及为通过网络的分布式路由设置发布者/订阅者通道。这样做的目的是什么?这个想法是建立一个p2p市场,还是具有某种较低级别的功能,例如广播预期的tx费用?“ 这个功能今天看起来很像 前段时间的热点intent项目Anoma(基于隐私和意图的区块链基础设施),下面是原邮件列表。
头雁 tweet media
中文
665
38
707
152.9K
头雁
头雁@alacheng·
Tavily 的search 服务用起来还是最好用的,包括中文方面的检索,尝试过国内的一家,结果真的是很烂,很多seo的内容经常被检索出来。大家都口口声声说是AI native,为agent设计,但实际在产品细节里很多细节才能看出谁真的是agent设计,比如Tavily在api 文档页有个小功能,可以直接复制整个api页面,很方便交给codex和cc这类工具支持实现api支持。怪不得2月就被并购了。 Tavily Search(Tavily)被 Nebius(NASDAQ: NBIS)收购。 交易金额:据彭博社等报道,估值约 2.75 亿美元(现金交易),部分来源提到若达成某些里程碑,金额可能最高升至约 4 亿美元。 收购方:Nebius Group NV,一家专注于 AI 云服务的公司(前身为 Yandex 国际业务部分,2024 年分拆),提供 AI 算力、数据中心和相关基础设施,市值当时约 234 亿美元。 tavily.com
中文
3
0
13
985
头雁
头雁@alacheng·
@JayM9x 是的,可用了。主要还是性价比
中文
0
0
0
563
头雁
头雁@alacheng·
Cloudflare也采用了kimi2.5作为内部工程师的code agent的基础模型 Cloudflare(美股上市公司,市值约 770 亿美金)最初只是做实验,把 Kimi K2.5 当作内部编码agent使用。工程师们每天用它在 OpenCode 环境执行任务,还把它集成到自动代码审查流程中,通过 GitHub 的 Bonk 代理观察运行情况。 每天处理 70 亿token,原本用大型专有模型(openai或Anthropic),每年仅维护一个代码库就要花 240 万美元;切换到 Kimi K2.5 + Workers AI,成本瞬间降低 77%。 前几天的Cursor 套壳kimi的 Composer 2 也是从 Kimi K2.5 出发,通过RL训练,coding 能力已经足够日常开发,kimi2.5看来真的是在coding场景能打打了。 cursor真的把开源社区成果给商业化了🤣(赢麻了),Composer 2 基础模式用kimi2.5,rl训练看起来主要是压缩长程的上下文,而看他的技术blog:cursor.com/blog/self-summ… 可以看出来基本没什么真的自己的创新,开源早就有很多基于rl的上下文学习压缩论文和方案了,看起来也是参考了很多。 blog.cloudflare.com/workers-ai-lar…
中文
7
5
67
15.3K
索南
索南@SonamNerd·
@alacheng 国产这几个(还有 GLM 和 MiniMax),我一直没能看到一个比较权威比较说哪个 Coding 更强。 另外,好像都是基于 DeepSeek 架构的,理论上 DeepSeek v4 出来应该很能打。(不过他家好像不搞coding plan、 token plan什么的)
中文
2
0
1
1.6K
头雁
头雁@alacheng·
@SonamNerd 看了一些性能测试报告,GLM看起来也不错。最新的cursor技术报告里有,可以看看也
中文
1
0
1
818
主任
主任@zhuren1992·
@alacheng Kimi2.5在coding场景确实能打
中文
1
0
1
826
头雁
头雁@alacheng·
@Koralan111 基本等同于骗子。这么大的国家总统
中文
1
0
2
121
本林作业本
本林作业本@benlinbaofu·
我的主账号 @baofuliu 是2021年注册一直到2026年,5年多了,主要是记录加密生活及偶尔刷刷骚逼视频。 1、一直是冲的蓝V。 2、前几天被冻结了。 3、今天收到蓝V续费扣款信息。 还有王法吗? 还有法律吗? 账号冻结了,会员扣费继续? 号死费还在?这不合理啊,希望核实 @X @elonmusk @nikitabier
本林作业本 tweet media本林作业本 tweet media
中文
6
1
6
1.8K
Laughing🪁
Laughing🪁@0xLaughing·
@alacheng 感觉kimi这套先打一巴掌再给个枣吃的操作很有东方智慧了...
中文
1
0
1
305
头雁
头雁@alacheng·
昨天被开发者爆出cursor的composer2模型是基于kimi2.5的后训练出来的模型。kimi今天官方就做了一次牛x的PR。之前用cursor的composer2模型感觉已经停不错了,虽然一次性完成任务没那么好(一般需要纠正几次),但是还是能感觉到coding能力已经够用了。 Cursor 没自己从零训一个顶级模型,而是拿 Kimi-k2.5 当底座,在 Fireworks 的平台上加了大量自己的继续预训练 + 超大算力 RL 优化 , 做成了 Composer 2。 为什么官方要特意加这句“Note”? 因为前一天有开发者扒出 Composer 2 的底层模型ID就是 kimi-k2.5 + RL 后缀 ,很多人质疑 Cursor “自研模型”却不提来源、是不是违反 Kimi 的开源协议(比如没标注来源、没给够分成/署名)。 Kimi 官方X出来先恭喜 Cursor 发布,然后补这一句,等于在说:是我们的模型没错 ,但人家是正规渠道通过 Fireworks 来的,不是私下乱用 ,合作没问题,大家别吵了,这是开源生态的正常玩法。 结果就是把原本可能变成“抄袭/侵权”的大瓜,变成了“中美AI公司合作共赢”的happy ending(至少表面上是)。 简单总结就是: Cursor 没自己从零训一个顶级模型,而是拿 Kimi-k2.5 当底座,在 Fireworks 的平台上加了大量自己的继续预训练 + 超大算力 RL 优化 , 做成了 Composer 2。 一切合法、有钱一起赚、互相@宣传PR。
Kimi.ai@Kimi_Moonshot

Congrats to the @cursor_ai team on the launch of Composer 2! We are proud to see Kimi-k2.5 provide the foundation. Seeing our model integrated effectively through Cursor's continued pretraining & high-compute RL training is the open model ecosystem we love to support. Note: Cursor accesses Kimi-k2.5 via @FireworksAI_HQ ' hosted RL and inference platform as part of an authorized commercial partnership.

中文
8
0
17
3.3K
头雁
头雁@alacheng·
我记得美团也出过一个类似的 “还会跑代码组合数据来验证, 在局部和全局层面检查结论.” 。 应该在2个月前。
中文
0
0
0
281
karminski-牙医
karminski-牙医@karminski3·
我给 SOTA DeepResearch 包了个 SKILL! 陈天桥团队的 MiroThinker-H1 发布了! 我没想到更新能这么快, 为了方便用我直接给大家包了个龙虾用的 SKILL, 可以直接在龙虾里面用 MiroThinker了! 他们上次更新是仅仅是两个月之前发布的 MiroThinker-1.5. 没想到2个月过去又发了新版, 这次是 MiroThinker-H1 和 MiroThinker-1.7 (开源版本). 同样这次仍然在 Deep Research 上进行了提升, 最大的特征是支持了长视野推理 (持续记住目标, 管理阶段状态, 跨多轮也能保持方向不跑偏) 和深度多步分析 (把一个复杂问题拆成多个彼此依赖的分析步骤, 而且每一步都有明确作用). 我也看了技术报告, 给大家说说为什么能做的这么好: 他们论文里给到的结论是单纯把推理链拉长, 然后期望"想的多就结果好"是不行的, 把每一步 agent 行为本身训练得更可靠效果才会好, 然后上下文管理和重试机制交给框架, 用外部来控制减长链任务里的噪声积累(模型思考中的"这个怎么不行, 我重试一下", "报错信息xxx"这些就能剔除掉了, 避免模型失焦). 最后在 MiroThinker-H1 里进一步把验证过程纳入了推理,这就很像人类做研究的流程了, 不只是会搜会想,还会跑代码组合数据来验证, 在局部和全局层面检查结论. 得到的结果就是 BrowseComp 直接达到了 88.2 的SOTA分数. 这是个测试AI 浏览网页找信息能力的专项测试, 最终得分没有其它模型比这个分数更高了. 另外他们的 Deep Research 框架 MiroThinker 也有很多机制上的提升, 比如最近几次提交就增加了个"失败总结后重试"的开关(Commit 4b931f8), 用来控制失败重试时,是否生成 failure summary 并带着这份总结继续重试. (研究报告中说的上下文管理和重试机制交给框架) 这种优化意味着团队意识到 "让AI总结失败经验"不一定永远是正收益,有时候反而会污染下一轮上下文. 之前1.0 和1.5版本的体验, 大家应该对性能都有目共睹了, 现在已经不是好不好用的问题, 而是怎么用得爽的问题, 我直接给官网包了个龙虾 (OpenClaw) SKILL, 自己把登录凭据配置到龙虾里面就能用了! 只需要输入 /miromind + 你想要调研的问题就行了. MiroThinker-1.7 模型地址: huggingface.co/miromind-ai/Mi… MiroThinker DeepResearch 框架: github.com/MiroMindAI/Mir… 我写的 Miromind SKILL 地址: github.com/karminski/miro…
karminski-牙医 tweet media
中文
9
15
96
13.3K
头雁
头雁@alacheng·
Vibe Coding 避坑指南之 trae 极其不靠谱,付费后使用还要排队(真想给张一鸣一大比兜),现在主要用codex(很棒)和google的了。
头雁@alacheng

最近用curson小心了,他的月度订阅,即使是一个新的月度周期的开始几天,很快他就会在ide提示里引导你按需付费,一不小心,就会误操作。从而在你订阅账户里乱扣费。我已经取消curson订阅,同时使用google的和阿里的code ide了。我是每个月14日是一个订阅周期,在订阅周期里他扣了好几笔按需费用(我没有主动开启过,应该是误点击了 )。curson @cursor_ai 的商业模式应该是存在一些问题,导致他最新的策略调整(引导你误点击按需),分析应该是vc给的压力不小,而本身业务又是很难赚钱的烧token模式。另外基本上现在你用的基础月度订阅,只能用他的模型(其他更好模型基本不给用),他的模型最大的问题就是经常会在一些问题上死循环,反复。

中文
6
0
10
1.5K
头雁
头雁@alacheng·
@Suu766 都是当土皇帝当惯了
中文
0
0
0
11
Suu
Suu@Suu766·
@alacheng 现在很多公司都会拿一堆理由来压着
中文
1
0
0
7
头雁
头雁@alacheng·
“不能推上神坛&公司不能接受非理性的要求不计代价来挽留” 这事后还说这种话,更是不应该,这种话不适合现在说。发哮成事件了,就说明前面做的有问题,加上这种话这个局面更难搞了。🤣 另外管理者一点不考虑政治(影响)因素更不靠谱,是刚下学的小朋友么,还装单纯?
中文
2
0
10
6.7K
Xinyu Yang
Xinyu Yang@Xinyu2ML·
中文发一下今天通义大会的内容吧,感觉是没有转机了 1. 首席hr自称这波调整是扩充更多人才,提供更多资源 2. 阿里是模型公司,qwen是集团的事情,而不只是基模的事情,集团来做大闭环,要快速发展,组织形式没沟通好 3. qwen是集团最重要的事情,希望人才来扩大,必然涉及到阵型变化,无论怎么变化希望大家做好。什么东西都不是没有代价的。用junyang一个人的脑子来处理肯定高效,但站着jingren的角度,需要考虑把zhouhao放在什么位置上比较高效,全过程没有考虑过政治因素(btw昨天高层的说法是,zhouhao比较担心一开始融不进qwen团队,所以主动要求把自己先放在jingren下面,高层就答应了) 4. 我们做的事情很宏大,100多个人肯定不够,需要扩张,很难照顾到每个人的想法 5. 吴妈说中国国情特殊,资源很难大家都满意,道歉没有更早知道资源的问题。说是中国最激进寻求算力的ceo,Qwen是第一优先级&尽了中国CEO最大的努力了。 6. 关于资源被集团卡脖子,吴妈说不知道被卡,心里一直优先级是最高的,问题是信息传递流程的问题 7. jingren说一直资源紧张,在做整体规划,然后说自己也是被架空的。然后说内部阿里云不好用是历史原因 8. 然后下面问junyang能不能回来,首席hr说:不能推上神坛&公司不能接受非理性的要求不计代价来挽留,并问台下那大家觉得自己是什么代价呢
中文
232
160
1.1K
1.3M
头雁
头雁@alacheng·
@maxiaofang @Xinyu2ML 就是空降google deepmind人才来领导。byte去年就是这么干的
中文
0
0
1
1.1K
头雁
头雁@alacheng·
@Xinyu2ML 除非了zhouhao有绝对的实力 ,加上这么一搞,这么空降真的挺难。本身jingren的管理和沟通有问题,不然不会出现多个离职和现在局面。
中文
2
0
34
21.3K
K.Y.
K.Y.@tekkamandeadend·
@imaxichuhai 有一说一,不要制造焦虑。“随便找了个” “每单利润3元” “ 完全被动收益” 这些词 都经不起推敲。
中文
3
0
123
19K
阿西_出海(2.0版)
阿西_出海(2.0版)@imaxichuhai·
卧槽!这是我见过最适合 OpenClaw 的落地场景——闲鱼电影票代买变现 12w+ 电影票代买之前一直是人肉模式: 用户发截图→卖家手动查价→改价→出票 现在这些店铺已经 AI 全自动化了,流程是: 1、用户发选座截图 2、AI 自动识别影院、场次、座位信息 3、用户下单,AI 自动改价,拍下后直接出票。 全程自动化,不需要人工 我随便找了个销量高的店铺,232 天卖了 4.2 万份,单笔利润按照最低3元算,保守估计盈利 12w+ 关键是这完全是被动收入,这不香么
阿西_出海(2.0版) tweet media阿西_出海(2.0版) tweet media阿西_出海(2.0版) tweet media
阿西_出海(2.0版)@imaxichuhai

普通人怎么抓住 AI 这波机会? 闲鱼直接给答案,OpenClaw 定制服务定价四位数 我询价了一个简单的 AI 日报需求,卖家直接报价 600 这就是纯纯的信息差,墙外大量免费的开源 skill 随便用,拿到国内就是降维收割。

中文
111
290
1.8K
818.1K
头雁
头雁@alacheng·
@MichaelGneiting 我这个是自己开发的版本 界面啥的都是自己定制的 开发了一个月了
中文
0
0
0
86