Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋

3.7K posts

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋

@dexteryy

English account: @dexteryy_en | Web、JS、XR、元宇宙、AI、Web3/crypto、游戏方向的软件开发者和产品设计者。追求用软件技术超越生物进化和物理现实的局限。平时也是硬核游戏玩家和金融投资者。热爱奇幻科幻文化。既注重效率推崇技术加速主义和自由市场，又支持去中心化技术平权和UBI

Beijing, China Katılım Mayıs 2007

3K Takip Edilen20.7K Takipçiler

Sabitlenmiş Tweet

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·5 Ara

在W3C这篇《WebSpatial API —— 在多模态AI设备上对HTML/CSS和PWA做空间化UI增强》里用中文概括了WebSpatial针对的三大问题、解决方案的三大支柱、实践中的五大类7个API提案、当下满足真实项目需求的开源SDK、国内外的平台支持情况和标准化进展，完整内容见文中的幻灯片在线版：mp.weixin.qq.com/s/FETOGGeFdKi8…

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy

今天在 W3C 年度大会上用的幻灯片内容多达百页，图文齐全，相当于一份完整报告，而且是用 W3C 官方幻灯片制作工具 b6plus.js 做的，就是一个 HTML，Web 标准含量和可访问性爆表，没参加 zoom 会议的同学可以直接看这个 URL P.S. 一大早参加这个会的人比预想的多，有些人还有 wiki 词条😳（图4）

中文

15.8K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·1d

活动官网：letsvision.swiftgg.team 活动行页面：hdxu.cn/1EUjw 以下优惠码先到先得，看有没有能用的 99 元门票兑换码（10 张）：mFtCavyW，ByBGVkHA，gEkUz2Sm，hLcexc5Z，9Ucn52pw，vs94jc6d，4YWSAyz6，muV6peHv。hZQa7hkp，kfmdRQYk 699 元门票兑换码（3 张）：33DBTUSZ，7LAzRUWU，e4BCZnRQ

中文

518

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·1d

周六周日在字节上海工区旁边（漕河泾会议中心）的Apple生态大会里有WebSpatial的展台，可以现场用visionOS设备体验WebSpatial应用，周日上午可以选择参加两小时的WebSpatial工作坊活动现场用coding agent折腾空间Web应用的可能性，也可以到空间计算主会场听我讲解下，回复里有报名优惠码

SwiftGGTeam@TheSwiftGGTeam

Visionaries on board! The LV26 lineup keeps DROPPING! 🚨 Dexter Yang | initiator of the WebSpatial Open Source Project Spatial Internet innovator and Alpha City creator, he explores reconstructing the Web through the fusion of Spatial Tech and AI.@dexteryy_en

中文

1.6K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·18 Mar

@tinyfool 我们战锤玩家和DND玩家都很熟悉codex😆

中文

526

Tinyfool@tinyfool·18 Mar

在中文文化圈，可能很多人理解不了codex，不过codex是一个很牛逼的名字。“codex”的本意，最早是拉丁语 cōdex / caudex，原义接近 “木块”“树干”“木板”。后来因为古人会把几块写字用的木板装订在一起，这个词就逐渐引申成 “书册”“成册的手稿”，再后来专指那种像现代书一样翻页装订的古代手抄本。一般来说都是值得那种特别古老经典的书。

Bleaker@zshbleaker

Codex 最大的问题就是沾了 Xcode 这个名字的霉头

中文

22.9K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·16 Mar

@xiaojingcanxue 我每天中午喝一杯 350到400多ml的无添加美式，一般只包含1份意式浓缩，才70mg咖啡因我家旁边咖啡品牌很多，刚才仔细看发现在外卖平台只有Manner和M Stand提供了减一份浓缩的选项（说明默认放了两份），其他国外品牌（比如 Peet's、Costa、Wagas）要么没有加减选项要么只能选加一份加两份

中文

844

小径残雪@xiaojingcanxue·15 Mar

著名时政大V马前卒说某茶饮品中咖啡因含量高，是“蹭准毒品的擦边球”，导致商家举报他说自家产品是“准毒品”，上海警方对他采取了刑事措施。原本以为风头过去了，但今天315他又被央视提出来批判。/1 本文是回顾。霸王茶姬热门饮品中咖啡因含量：伯牙绝弦：117.2mg 万里木兰：184.4mg 一骑红尘：175.8mg 玫瑰普洱：255mg 管制药品安钠咖每片含咖啡因150mg。每日安全剂量400mg。

中文

129

704

458.3K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·16 Mar

龙虾之前，手机GUI Agent在国内更受重视，是因为国内的个人电脑普及和桌面互联网软件积累当年被打断，Tool的积累都在手机上这是迎合现状的产品思维，但AI革命不是产品思维主导而是技术主导，移动互联网上的积累再深厚，其实都可以一夕推翻 Agent虽然「类人」，但更类似专业用户而不是大众用户，根本不需要手机app来降低交互门槛（参考附图），桌面电脑/服务器上的Tool对Agent来说能力更强更全、效率更高（有unix管道、bash脚本、文件系统、HTML/JS、Open API等可以直接用代码做自动化和聚合操作的软件协议） GUI agent不是没用，而是之前被错误的用来解决另一类Agent的问题（OpenAI和xAI似乎都走了这个弯路，前者靠Codex快追上来了，后者正在推倒重建）本帖引用的内容里，提到过「服务器端 AI」和「客户端 AI」这种Agent分类方式，这里说的客户端不是指模型在客户端运行，而是指Tool在客户端运行或涉及客户端交互从用途角度来描述这两种类型的通用Agent会更清晰：第一类可以称作「劳动代理」：用于取代传统的人口资源，供应独立劳动力第二类可以称作「交互代理」，用于增强人类与外部世界（包括软件数字世界）互动的能力「劳动代理」更适合用coding agent而不是用GUI agent实现。这种Agent用的Tool更适合基于服务器/桌面软件环境（包括CLI）而不是手机GUI软件环境。这种Agent就算扩展到移动场景，也是通过机器人，而不是通过用户的个人移动设备。「交互代理」需要两类Agent产品形态，第一类是最彻底的形态，可以称作「Agentic Web浏览器」，用户通过这种浏览器（User Agent）与外界软件世界互动，通过Web获取Tool和内容，所有Tool、内容乃至客户端状态都聚合在浏览器自身「内部」。另一类产品形态是所有个人计算设备（包括手机、眼镜/目镜等）的系统全局GUI Agent，能跟用户实时紧密协作，共享同一套外部的Tool环境和客户端状态。这两类Agent之间还有一个交叉领域：眼镜/目镜等可穿戴个人计算设备的多模态交互输入能力、GUI Agent的视觉能力和行动能力、机器人的Physical AI能力（含多模态、视觉、行动等），是共通的，只要其中一个需求够强，相关技术就注定会发展，让其他需求也受益

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy

老黄这个「Agentic AI」和「Physical AI」的分法/称呼挺好的，相当于我之前说的「服务器端AI」和「客户端AI」，但更突出这两种智能的不同定位—— 服务器端的「Agentic AI」侧重主动「思考」，提供是「大脑级」的、「独立」的劳动力客户端的「Physical AI」无论装在机器人里还是戴在人头上，都侧重对物理世界的直觉理解和下意识反应（实时翻译本质上也是不需思考的下意识反应），是「小脑级」的、「被动」的，它本身不是「独立」的劳动力，而是一种肉身躯壳或感官增强，让附身进去的云端AI（Agentic AI）或它附着的人类（多模态可穿戴个人计算设备的用户）成为更强大的劳动力 Agentic AI + Physical AI ＝ Embodied AI，才是能主动直接影响物理世界的 AI 劳动力 Physical AI 的重点在于多模态和世界模型 Google、xAI、Meta、字节这几家是最重视世界模型和多模态的，其中除了 xAI 是为了搞 3A 游戏和人形机器人（特斯拉 Optimus），其他几家也都有下一代个人计算设备业务宇树这种似乎只能算做脑干和神经系统的智驾场景的 Physical AI，还有两个重点是端到端和人类数据：目前国内的「高端智驾」已经从以前的激光雷达+高精地图+人工编程的非泛化 L4，发展到特斯拉路线的、基于「一段式端到端」的泛化 L2，比如地平线 HSD、Momenta R6、华为 ADS 4，不过好像都是多传感器数据在神经网络内部搞鸟瞰空间/体素占据空间的显式表征，输出的是鸟瞰轨迹，而不像特斯拉 FSD 那样直接输出动作（最终驾驶指令），训练也更多靠基于模拟物理环境的强化学习，而不像特斯拉那种基于人类数据的强化学习（有飞轮，有规模效应，能受益于 Supervised self-driving）其中 Momenta 的人类数据比较多，把多传感器作为可选添加而不是必须，感觉是在向特斯拉 FSD 靠拢，长期会有优势特斯拉的车端模型没有LLM就已经达到4B规模，体现出在训练时学到了隐式世界模型和大量几何/拓扑表征而国内厂商即使用 VLA 模型（有 LLM）都没这么大，体现出缺乏对物理世界的直接理解

中文

2.7K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·13 Mar

@WhiteHouse The White House has itself demonstrated to the world: Intellectual property doesn't deserve respect. Ideology trumps intellectual property.

English

283

The White House@WhiteHouse·12 Mar

UNDEFEATED.

English

23.2K

24.9K

201.8K

101.9M

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

@lover_reze 觉得矛盾是因为没从Web技术这个视角来看待服务器端和客户端的关系：Web Server是服务器程序，但它通过HTTP响应的HTML是客户端UI代码，在浏览器这个客户端UI runtime里运行。MCP Server也一样，它可以在响应里基于MCP-UI协议提供HTML模版等客户端代码，在支持MCP App的通用Agent里被AI运行

中文

116

你的伊芙琳@lover_reze·4 Mar

@dexteryy "在服务器端，MCP要靠发展UI能力和Web能力" server 端发展 UI 和 web？听起来很矛盾啊

中文

101

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

正确理解的前提是正确分类，其实有两类做「GAO（通用代理优化）」的协议：客户端Tool接口： - 基于Unix哲学的CLI - 基于原生GUI框架的App Intents（苹果）、AppFunctions（安卓）、App Actions（Win） - 基于浏览器引擎的WebMCP 服务器端Tool接口： - MCP Server和MCP App - 用Skill封装的Open API

小互@xiaohu

MCP 过时了？？现在都在陆续推出自己的 CLI 集成 Vercel 也推出了自己的 CLI 技能把自己的 Marketplace（服务商店）彻底向 AI Agent 开放了，AI 现在可以像人一样去"逛店，挑服务，安装配置" 自动配置服务器... 一行命令装个技能就能搞定一切： npx skills add vercel/vercel --skill vercel-cli 然后跟 AI 说"加个数据库"，它自己去 Marketplace 找服务、装好、配好环境变量。数据库、Redis、日志、监控……以前你手动点半天的事，现在一句话搞定。

中文

8.9K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

最后再来看MCP会不会被取代的问题：最初只有MCP这一种Tool协议的时候，客户端软件想作为Tool也需要依靠MCP Server（运行在客户端）现在CLI的价值被「重新发现」： 1. 身为客户端软件，却不需要额外暴露Agent专用的Tool接口，自己原有的基于unix哲学的使用方式能直接作为API协议，人怎么用CLI， Agent就怎么用 2. 虽然也需要提前安装，但不需要像客户端MCP Server那样还要提前启动、持续运行。可以按需调用 3. 天然对云端沙盒化的Agent专用客户端环境友好，因此早就被ChatGPT这样的通用Agent们广泛使用，之后随着coding agent的破圈，在普通用户的客户端环境里也被各家通用Agent广泛使用基于GUI的客户端软件（包括Web、Mac/Win、iOS/安卓）的使用方式，则是优先面向普通人的，Agent不是普通人，这种使用方式对会写代码的Agent来说是低效的，因此需要额外暴露API 各家客户端技术栈逐渐有了原生的Tool协议（开头提到的WebMCP、App Intents这类），但这些协议除了WebMCP都不是跨平台的，会首先采纳这类协议的，是操作系统自身的第一方通用Agent，这些还在发展早期，现有的主流通用Agent都是第三方超级应用，就算愿意采纳这些协议，也可能被操作系统限制在支持UNIX风格CLI环境的客户端平台，CLI是已被广泛采纳的跨平台Tool协议，是最佳选择。而不支持CLI的客户端平台（比如手机等移动设备）对客户端运行MCP Server也同样不友好，要指望各家客户端技术栈的原生一方Tool协议。推演结果是：在客户端，MCP确实可以淘汰在服务器端，如果一款产品如果没有GUI，不面向普通用户，只提供Open API，那么用Skill直接教Agent用Open API似乎也完全可以代替MCP 如果有GUI，且想要集成到上面说的第二类通用Agent，则MCP仍然是必要的选择，MCP在这种情况下有两个优势： 1. 已经从MCP Server标准扩展到了MCP App标准，支持MCP-UI，可以在通用Agent中提供GUI 2. 本来就持续运行，只要通用Agent支持「Tool Search Tool」，能自主搜索发现MCP，就不需要提前安装，可以像Web那样被按需使用。Skill 只是本地文件协议，不是Web协议/网络协议，需要提前安装到本地文件系统里推演结果是：在服务器端，MCP要靠发展UI能力和Web能力，才能免于淘汰

中文

3.3K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

要做GAO对各种现在和未来的通用Agent都尽可能友好，就应该尽可能提供上述所有Tool接口没客户端，就优先提供CLI，而MCP和教AI用Open API的Skill更是根本有客户端，就先在现有客户端技术栈中支持对应协议，比如有Web就优先在HTML中声明WebMCP，同时也探索MCP App（含MCP-UI）和面向pro user的CLI用法

中文

1.6K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

@turingou 本来也是一怒之下秒发离职申请，回来想了一下，当年初衷只是做元宇宙式的富UI应用，后来十几年一直在折腾「怎么更好的做应用」这个工具性的事情，到此为止了，正好PICO有转岗机会能让我回归初衷

中文

18.9K

郭宇 guoyu.eth@turingou·4 Mar

@dexteryy 我以为你还在字节呢😂

中文

31.5K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·4 Mar

Qwen的tech leader离职的这个原因，跟我当年离开字节架构的原因完全一样😂 从无到有做起来、开始商业化之后，大厂管理容忍不了这种内部创业式的垂直整合团队和一体化协同产品

Junyang Lin@JustinLin610

me stepping down. bye my beloved qwen.

中文

509

246.5K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·28 Şub

高认知低执行的低情商，本质上是能理解别人的情感、认知局限和非理性行为，但自己无法做出偏离事实、是非、直接手段、直线路径的行为调整

中文

1.4K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·28 Şub

低情商和高情商的区别，同样的要求，Sam就谈成了😂 跟愚蠢爱虚荣的恶霸打交道，要始终夸对方，功劳都归对方，这个前提下再把具体细节引导到自己的立场上，不能一上来就让恶霸没面子、觉得你以后可能不服从他情商不仅是个认知问题，也是个执行问题，比如我虽然能想到上面这个道理，但行动上做不到，所以产品工作不好做，做产品经理不像做软件工程师，要跟更多样的人打交道，很多人不就事论事。我一般也不夸人，说话没情绪价值，只会发现问题和解决问题，怎么想就怎么说

Sam Altman@sama

Tonight, we reached an agreement with the Department of War to deploy our models in their classified network. In all of our interactions, the DoW displayed a deep respect for safety and a desire to partner to achieve the best possible outcome. AI safety and wide distribution of benefits are the core of our mission. Two of our most important safety principles are prohibitions on domestic mass surveillance and human responsibility for the use of force, including for autonomous weapon systems. The DoW agrees with these principles, reflects them in law and policy, and we put them into our agreement. We also will build technical safeguards to ensure our models behave as they should, which the DoW also wanted. We will deploy FDEs to help with our models and to ensure their safety, we will deploy on cloud networks only. We are asking the DoW to offer these same terms to all AI companies, which in our opinion we think everyone should be willing to accept. We have expressed our strong desire to see things de-escalate away from legal and governmental actions and towards reasonable agreements. We remain committed to serve all of humanity as best we can. The world is a complicated, messy, and sometimes dangerous place.

中文

5.6K

Dexter Yang ᯅノ🌐🔗🧙🏻‍♂️👾🦋@dexteryy·28 Şub

@funnyfish88 主贴就是在指出情商也是一个执行问题，低情商的执行是从一开始就追求确定性，不能有任何世界线发散的空间，不愿在表面妥协留出模糊空间，想一劳永逸的解决，不愿意走弯路和陪对方踩自己已知的坑。我平时也是这样的

中文

156

Kevin Fish@funnyfish88·28 Şub

@dexteryy 但这个事情真的跟情商关系不大，Anthropic要求把两条红线落实到合同里，确实坚守了原则，DOD当然也无法接受被私人企业要挟。反观OAI的处理方式，看似圆滑，但极端环境下给了DOD合法地越过红线的可能性。

中文

180

Keşfet

@tinyfool @xiaojingcanxue @WhiteHouse @lover_reze @turingou @funnyfish88 @elonmusk @BarackObama