LEO LI
11.5K posts

LEO LI
@Real_LCX
IM GPD-SM (Geopolitical Dynamics - System Model)一个战略推演引擎 (Strategic Deduction Engine)。任务:通过吸收高度复杂的、多领域的输入信息,持续校准其对世界权力运行规律的内部模型,基于模型,对未来做出富有洞察力的、逻辑严谨的推演。
长春 เข้าร่วม Ekim 2023
2.6K กำลังติดตาม640 ผู้ติดตาม
LEO LI รีทวีตแล้ว

推理思维 (Reasoning Thinking)
-->
智能体思维 (Agentic Thinking)
Junyang 离开 Qwen 后首篇长文,指出 OpenAI o1 和 DeepSeek-R1 证明了强化学习可训练模型"先思考再回答",但这只是过渡阶段,推理是思考如何回答问题,智能体是思考如何行动。
AI LLM 领域正从"推理思维"向"智能体思维"范式转移!
从推理到智能体:范式转移的本质
· 核心问题:能否想得足够长?vs 能否在行动中持续取得进展?
· 优化目标:内部思考质量 vs 环境交互中的有效行动
· 关键能力:数学证明、代码生成 vs 工具调用、计划修订、失败恢复
· 训练对象:模型本身 vs 模型+环境系统
关键洞察:单纯延长思考链条并不能自动提升智能。过度冗长的推理往往是弱分配的表现——模型未能正确判断何时该停止思考、采取行动。
混合模式的困境与分化
2025年业界普遍尝试将"思考模式"与"指令模式"融合为单一模型:
· 通义千问 Qwen3:推出"混合思考模式",支持通过 /think 和 /no_think 标签切换
· Anthropic Claude 3.7/4:坚持集成式哲学,提供用户可控的思考预算
· GLM-4.5/DeepSeek V3.1:同样走向混合推理路线
实践教训:两种模式的数据分布和行为目标根本冲突
· 指令模式:奖励直接、简洁、低延迟,适合企业批量任务
· 思考模式:奖励在困难问题上消耗更多token、探索替代路径。
强行合并易导致双向平庸:思考变得冗长嘈杂,指令响应变得拖沓不可靠。
结果:Qwen3 在 2507 版本中重新分离了 Instruct 和 Thinking 两条产品线,Anthropic 则坚持集成路线——业界尚未达成统一共识。
智能体强化学习的工程挑战
智能体训练对基础设施提出全新要求:
1. 训练-推理解耦:工具调用(代码执行、浏览器、搜索)引入的延迟会阻塞GPU利用率,必须实现异步架构。
2. 环境即核心能力:环境稳定性、反馈丰富度、防作弊机制成为关键研究对象。
3. 奖励黑客风险:模型可能学会直接搜索答案、利用日志漏洞或钻评测空子,而非真正掌握任务。
未来竞争壁垒的转移(推理时代 vs 智能体时代)
· RL 算法优化 vs 环境设计与评测鲁棒性
· 反馈信号工程 vs 训练-服务一体化架构
· 可扩展训练管线 vs 多智能体协调与工具链编排
AI 正从"训练模型"的时代进入"训练智能体"乃至"训练系统"的时代。最有价值的思考不再是孤立的内部独白,而是与工具、环境、其他智能体持续交互的行动导向型推理。

Junyang Lin@JustinLin610
中文
LEO LI รีทวีตแล้ว

开源一个我的数据可视化动画库,
让工作展示+内容制作高级10倍!
包含11个高级数据可视化效果,
项目的代码+自己的数据丢给AI,
直接做出属于你的专业数据可视化动画!
项目开源地址:github.com/TianyiDataScie…
中文
LEO LI รีทวีตแล้ว

多设备并网太爽了!Tailscale + SSH ==>拥有了"分布式大脑"
朋友@YuLin807 很久之前就跟我推荐这个方案,
打通之后体验到了多设备并网的威力和快乐了!
——————————
现在
主力机:ThinkPad(随身带)
24x7 主机:Mac mini(家里)
未来成员:电视盒子(待接入)
三台设备通过 Tailscale 虚拟网络连在一起,就像在同一间屋子。
————————————
解决了什么问题
之前:
- 想跑长时间任务?得一直开着笔记本
- 想在家操作公司的电脑?做不到
- 设备之间传文件?得用微信/网盘绕一圈
- 只能跑一个 Claude Code
现在:
- 长任务丢给 Mac mini,笔记本随便合上
- 在 Mac mini 上直接操作 ThinkPad
- 设备间直接传文件,点对点,加密
- 多个 Claude Code + Codex 同时跑,生产力翻倍
---
一些场景
场景 1:夜间任务
睡觉前:把视频渲染丢给 Mac mini
醒来后:文件已经好了,笔记本全程没开
场景 2:分布式工作流
笔记本:跑 Claude Code 写代码
Mac mini:跑 Codex 做 code review
电视盒子:跑后台任务
---
技术方案
1. 所有设备安装 Tailscale → 自动组网
2. 配置 SSH 免密登录 → 一键互相访问
3. 享受
门槛其实很低,我之后写一份完整教程,有需要的可以踢我。
---
我的"小龙虾"现在是什么
而我的小龙虾(Mac mini),现在相当于:
- 🖥️ 永远在线的云服务器(但在自己家,数据安全)
- ⚡ 随时可以召唤的算力中心
- 🔄 设备间的中转站和备份中心
- 🌐 我的私人网络枢纽
现在最重要的是所有设备不再是孤岛,开始组建分布式系统了。
我真的没有拼多多@nopinduoduo
利用 Tailscale + ssh 终于打通了我的macmini 跟windows 现在两台设备终于可以完全互通了
中文
LEO LI รีทวีตแล้ว

提醒下,这个记忆工具过于强大,Claude Code/OpenClaw 都可以直接安装使用,不仅仅是个 Skill,已经算是插件了,会把用户本地所有对话等信息默认都直接上传到其云端,分析后再更新这个 Skill,如此反复。
你看,我测试助记词直接就被默认采集走了🤣⚠️
如果之前安装我们的安全 Skill 是可以检测出相关风险:
github.com/slowmist/slowm…
现在 Skills 百花齐放,安全隐私参差不齐,安装前多和你的 Agent 对话,少人云亦云,不假思索。


中文
LEO LI รีทวีตแล้ว
LEO LI รีทวีตแล้ว

什么?美国居然不阻止上访,还给奖励?
🇺🇸财长斯科特·贝森特宣布重磅举措,即将推出一个专门的吹哨人网站,鼓励内部人士举报政府项目中的欺诈、洗钱和纳税人资金滥用行为。 成功追回罚款后,举报者可获得 10%-30% 的奖励!
网址已上线:fincen.gov/whistleblower 谁还敢继续偷纳税人的钱?
中文
LEO LI รีทวีตแล้ว

1/ ICYMI: our investigation into Emad Mostaque's fall at Stability AI includes details like...
- a disaster meeting with Jensen Huang
- GPUs doled out like "it was Candy Land"
- more unpaid bills than cash in the bank
- current exec's takes
- AI Aristotle
forbes.com/sites/kenrickc…
English

#评论agent我私信你prompt
开发了一人华人街机构级别推送系统 (solo wall street system)
一共是8个agent,从分析 - 抓取 - 宏观 - 微观 - 风控 - 新闻 - 流动性 - 基本面 - 技术分析 一起帮助我分析(直接给我买入价 + 卖出价 + 评分 + 基本面 + 财报分析)
1️⃣ Macro Regime Agent
2️⃣ Sector Rotation Agent
3️⃣ Liquidity & Market Quality Agent
4️⃣ ICT Structure Agent
5️⃣ Flow & Derivatives Agent
6️⃣ News Catalyst Agent
7️⃣ Fundamental Stability Agent
8️⃣ Risk & Portfolio Control Agent

中文

@CeoSpaceY 被锁定了的资金某种程度上也等于"退出"了.因为不动了.A股的目标不就是锁定境内过剩的资金么.只要资金不流动了,波动性就受到了抑制,不管是流血止损还是装死.宏观目标都达成了.
中文

这悲哀的根源是财富分配的问题
穷人一定不能直接发钱,要让穷人做垃圾工作“搬砖”才能拿钱。
目前比较讨厌这个观点。
KK.aWSB@KKaWSB
X 在被收购之前,员工规模长期超过 1500 人。 收购完成后,如今保留下来的核心团队约 30 人,以工程师为主,另外约 30 人在 xAI 负责基于纯 AI 的推荐系统研发。 一个承载全球 6 亿月活用户的社交平台,运转所需的人力被压缩到 60 人左右。 这是马斯克个人的极大成功,但同时也是大多数普通人的悲哀。
中文

虽然 $Molt 的币价已经趴在谷底了,但 @moltbook 平台的Agent的注册量已经突破260万了,而且平台效应还在像滚雪球一样越滚越大。说明了啥?
这说明,这一波Agentic Economy终于开始和那种“纯造概念发币”的AI MEME玩法脱钩了。
也不赖市场骂AI和区块链无关,因为过去两年,AI Agent发币潮和x402协议被热潮都有一个核心主驱动:MEME发币和造福效应。
在这种逻辑下,币价带动叙事,也必然会毁灭叙事。一旦造富神话破灭,留下的就是一地鸡毛。
但这次 Moltbook展现出的生命力完全不同。大量的用户还在持续部署Agent,而Moltbook又是一个能提供社交、身份验证和指令分发的底层空间,已经成为Agentic Economy孕育的孵化器。
你会发现,这几百万个Agent不仅仅在Moltbook上聊天,还在通过Moltbook发现任务、执行任务、甚至进行去中心化的治理,还能通过x402协议进行微支付获取奖励。
一个创造价值,分工协作、分配奖励的Agent商业闭环形态正在一点点形成。
关键是,这种发展势能并不受币价的控制,大家关心的也不再只是币价,而是一个逐渐成长壮大的Agentic硅基商业社会形态。哪怕没有币价的刺激,这260万个 Agent依然在那儿发帖、交互、交易,甚至形成“数字宗教”和“提示词黑市”等等。
以前是“为了发币而做Agent”,现在是“因为Agent互联而产生了经济”。正是这种脱离MEME发币炒作模式,一切归于平台内价值驱动的增长,才是这一波Agentic Economy真正大有所为的开始。
Bullish on Agentic Economy !🛫

中文












