Alex
194 posts

Alex
@AlexLabx
💻 全栈开发,白天上班晚上 Vibe coding ❤️ 用 AI 做产品、从 0 到 1 的真实过程 🔗 Building in public · 探索 Web3
深圳 انضم Temmuz 2016
465 يتبع403 المتابعون

OpenAI 格局大了
宣布Codex (包含 App 客户端、命令行 CLI 和开发包 SDK)
支持直接接入任何开源大模型
不强制绑定 OpenAI 自家的模型
并且放出了一个文档:手把手教开发者如何把 Codex 客户端底层的“大脑”,替换成免费的开源模型…
Tibo@thsottiaux
Reminder that you can use the Codex App, CLI and SDK with any open source model, not just with OpenAI models. #oss-mode-local-providers" target="_blank" rel="nofollow noopener">developers.openai.com/codex/config-a…
中文
Alex أُعيد تغريده

Codex 操控电脑的三种方式。Codex 团队成员 Jason 今天写了一篇详细指南,把三者的区别和适用场景理清楚了,这里做个精简版。
【1】Computer Use:最广,也最慢
Computer Use 让 Codex 像人一样看屏幕、点鼠标、敲键盘,操作你电脑上的任何图形界面应用。Spotify、Xcode、系统设置、iOS 模拟器,甚至 iPhone Mirroring 都能控制。
代价是慢。结构化插件可以直接调 API,Computer Use 得一步步看界面、找按钮、等响应、再检查结果。但它能搞定没有 API 的应用,这是其他方式做不到的。
Mac 和 Windows 的体验差距很大:Mac 上 Codex 可以在后台静悄悄地操作,你继续用自己的电脑不受影响;Windows 上它必须占据前台,操作期间你没法用那台机器。
Jason 举了个例子:有次他的快递被偷了,Amazon 说要等 25 分钟才能接通客服。他让 Codex 每五分钟检查一次聊天窗口,客服出现后改为每分钟一次,自动完成退款流程。他去洗了个澡,回来退款已经办好了。
【2】Chrome 扩展:带着你的登录状态
Chrome 扩展让 Codex 使用你已登录的浏览器会话,包括 cookies、账号状态和已有标签页。Gmail、LinkedIn、Salesforce、公司内部后台,这些需要登录才能用的工具,Chrome 扩展是对的选择。
它还能同时控制多个标签页,在一个标签里读信息,到另一个标签里对比,再到第三个标签完成操作。Computer Use 也能操作浏览器,但它只认屏幕坐标,Chrome 扩展理解的是浏览器层面的上下文。
Jason 用它跑了一个长期任务:每天让 Codex 通过 Chrome 检查他的 Twitter 私信、浏览相关新闻、收集反馈,把有价值的内容存到本地文件,但不发任何消息。
要注意的是,网站会把 Codex 的点击和表单提交当作你本人的操作。研究、浏览、起草可以自动化,但发送、发布、付款这类操作最好留给自己确认。
【3】内置浏览器:给开发者的沙盒
内置浏览器住在 Codex 的对话线程里,你和 Codex 共享同一个渲染页面。它不带任何登录状态和 cookies,是个完全隔离的环境。
这反而成了开发场景的优势。它的主场是本地开发服务器、文件预览、公共网页、响应式布局检查和视觉 bug 复现。Codex 可以改代码、操作页面、截图、再跑一遍,形成紧密的反馈循环。
Jason 最喜欢的功能是标注:你可以直接在页面上点击某个元素留评论,比如"这个层级反了""这个按钮间距不够",Codex 会拿着截图和元素上下文去改代码,改完重新打开同一个页面等你下一轮标注。比来回传截图和文字描述高效得多。
【选哪个?】
简单记:任务需要登录状态用 Chrome,需要操作桌面应用用 Computer Use,在做前端开发用内置浏览器。如果有现成的插件或 MCP 能完成任务,优先用结构化工具,视觉控制是最后手段。
jason@jxnlco
中文

组织一次互关贴,就能增加400-500个蓝V关注。
想互关的,评论区留言。
行动起来,蓝V互动越高,老马的工资越高。

领哥LingGe🙏@shangdu2005
好久没有组织蓝V互关了。 开个帖子,大家可以互助。 经常活跃评论的我优先回关。
中文


















