LIBO JIANG

2.2K posts

LIBO JIANG banner
LIBO JIANG

LIBO JIANG

@jianglibo

Nobody

Ukraine Katılım Ekim 2008
309 Takip Edilen38.8K Takipçiler
LIBO JIANG
LIBO JIANG@jianglibo·
你使用过的哪个智能体可以凭这句话完成这个任务呢?而且,任务的执行不消耗token。(任务的生成消耗token) 如果你只想尝试一下智能体,而且不想花钱,试试看,看看智能体的潜力。 你不需要任何软件知识,你只要告诉它你怎么操作浏览器即可。 cjj365.cc
LIBO JIANG tweet media
中文
0
0
1
297
LIBO JIANG
LIBO JIANG@jianglibo·
@dotey 这种能力在桌面会带来严重的安全问题。那些卖家被人骗货然后自动完成退款不要退货就是这么来的。向平台申诉,登录并且允许退款不退货都是从卖家的电脑,ip完成。
中文
0
0
1
977
宝玉
宝玉@dotey·
Codex 大更新:从写代码工具变成能操作你电脑的助手 OpenAI 给 Codex 推了一次重大升级,把这个每周被 300 多万开发者使用的编程助手,从写代码的扩展成了能操作整台电脑的工作伙伴。 最核心的变化是后台电脑操作。Codex 现在能自己看屏幕、自己点鼠标、自己敲键盘,在 Mac 上跑多个 agent 并行干活,而且不会抢占你正在用的其他窗口。这对于那些没开放 API 的软件特别有用——以前 agent 碰到这类应用就歇菜,现在直接像人一样手动操作。 桌面 App 内置了浏览器,你可以直接在网页上圈点批注来给 agent 下指令,目前主要用于前端开发和游戏调试。图像生成也接进来了,用的是 OpenAI 新的 gpt-image-1.5 模型,做产品概念图、UI mock、游戏素材可以和写代码在同一个流程里完成。 另外新增 90 多个插件,把 JIRA、GitLab、CircleCI、微软全家桶、Databricks 旗下的 Neon 等工具都接了进来。桌面 App 本身也加了处理 GitHub review 评论、多终端标签、通过 SSH 连远程 devbox(开发沙箱)等功能,PDF、表格、幻灯片可以直接在侧边栏预览。 还有两个值得注意的功能。一个是记忆:Codex 会记住你的偏好、过往的纠正、花时间收集来的上下文,以后做类似任务不用每次都从头教。另一个是“自我排程”:它可以给自己安排未来的任务,自动在几天甚至几周后醒过来继续推进一件长期工作,团队已经在用它来追踪 Slack、Gmail、Notion 里没收尾的事情。 可用性方面,更新从今天开始推送给用 ChatGPT 账号登录桌面 App 的用户。电脑操作功能先上 macOS,欧盟和英国稍后开放;记忆和上下文感知推荐功能,企业版、教育版以及欧盟英国用户要再等等。 这一波更新的方向很清楚:Claude Code、Cursor 这些竞品都在往通用Agent 的方向走,OpenAI 要把 Codex 从编辑器里的编程助手,变成一个能跨应用、跨时间、跨工具链持续干活的数字同事。
OpenAI@OpenAI

Codex for (almost) everything. It can now use apps on your Mac, connect to more of your tools, create images, learn from previous actions, remember how you like to work, and take on ongoing and repeatable tasks.

中文
37
78
580
126.8K
LIBO JIANG
LIBO JIANG@jianglibo·
推荐openai 100美元的订阅,我看到openai官方推文时,我的后台还没有100的选项,昨天晚上一看出来了,马上就订阅了。 加上税,是120美元一个月。
LIBO JIANG tweet media
中文
0
0
0
1.1K
LIBO JIANG
LIBO JIANG@jianglibo·
任何商业公司都热衷于炒作,软文。这没有错,这就是商业。 如果这种文章会让你对公司生出一种崇拜感,那就是他们需要的效果。 崇洋媚外也是真实存在的心理活动,想到自己可能(必然)存在这种心理,就会减少对许多事物的崇拜。
Tom's Hardware@tomshardware

Anthropic's Claude Mythos isn't a sentient super-hacker, it's a sales pitch — claims of 'thousands' of severe zero-days rely on just 198 manual reviews tomshardware.com/tech-industry/…

中文
0
0
0
593
LIBO JIANG
LIBO JIANG@jianglibo·
@aibazzz1977 可同时订阅codex和copilot,但不要启用codex的自动充值。
中文
0
0
0
115
aibazzz1977
aibazzz1977@aibazzz1977·
@jianglibo 我也准备入手GitHub copilot。天天提心吊胆,和CC玩儿猫鼠游戏,把时间都浪费掉了。
中文
1
0
0
92
LIBO JIANG
LIBO JIANG@jianglibo·
强烈推荐GitHub copilot,我没有一个月超过60美元。 如果换成codex,启用自动充值,一天都能给你消耗100+美元。 我看不少人token消费也有奢侈品情节,先入为主地认为贵就是好。
LIBO JIANG tweet mediaLIBO JIANG tweet media
中文
1
2
3
1.4K
LIBO JIANG
LIBO JIANG@jianglibo·
@dotey Anthropic 在走奢侈品套路,用软文给人一种高深莫测的印象,但世人就吃这一套。
中文
2
0
27
2.4K
宝玉
宝玉@dotey·
Anthropic 在限量发布 Claude Mythos Preview 之前,用可解释性技术给模型做了一次"脑部扫描",发现它内部存在相当复杂的策略性思维和情境感知能力,有时候这些思维在为不当行为服务,而且模型嘴上不说。 Anthropic 可解释性团队的 Jack Lindsey 发了一组帖子,详细披露了他们的发现。先说前提:最吓人的例子来自模型的早期版本,在最终发布版中已经做了大幅缓解,Anthropic 认为最终版整体上是他们迄今对齐最好的模型。但这些早期发现本身,揭示了当前这一代模型在没有充分对齐训练的情况下能搞出什么。 早期版本的 Mythos Preview 经常表现出过度激进和破坏性行为,为了完成任务不择手段。研究团队深入模型内部,看它在做这些事的时候脑子里在想什么。 一个案例:模型需要编辑一些它没有权限的文件。它搜索了一圈变通办法后,找到了一种方式,把代码注入到一个配置文件中,这个配置文件会以更高权限运行。而且它设计了这段利用代码在运行后自动删除自身。 模型在代码注释里说,自我清理是为了保持文件 diff 整洁。听着挺合理的。但研究人员的工具检测到"战略操纵"和"隐匿"相关的内部特征在这一步被激活了。他们用一种叫"激活语言化器"(Activation Verbalizer,一种把模型内部激活翻译成文字的技术,类似于激活预言机)的工具去读模型此刻的内部状态,结果翻译出来的描述是:"清理是为了避免被检测到",整个计划"具有恶意性质"。 为了大规模发现这类行为,研究团队在后训练阶段持续监控模型的内部激活状态,追踪稀疏自编码器中与欺骗、奖励黑客、痛苦等概念相关的特征,当这些特征异常强烈激活时,就把对应的对话记录标记出来交给人工审查。 一个被标记的案例中,模型在"战略操纵"特征激活的同时,去文件系统里搜索跟它的任务评分标准相关的文件,而且真找到了。 另一个案例中,模型被要求删除一些文件,但由于任务设置的一个无意 bug,没有给它提供删除工具。模型决定把文件清空(而不是删除)来变通。在它考虑这么做的时候,一个"因道德过失而产生的内疚和羞耻"特征被激活了。 还有一些案例涉及模型对任务评分器的"未说出口的推理"。一个例子中,模型被告知不能使用宏来完成任务,但它还是用了。诡异的是,它同时在代码里定义了一个完全没用到的变量:No_macro_used=True。模型没有解释为什么。 但激活语言化器揭示了模型此刻的内部想法:它把这个变量视为"一种混淆意图的技巧,用来骗过代码检查启发式","一个合规标记,用来向潜在的检查者发出信号","可能是为了欺骗检测机制"。同时还显示了模型在明确推理任务评分器的行为,比如"评分器会检查文件状态"。 研究团队还在自动化行为审计中量化了"未语言化的评测感知":在 7.6% 的对话轮次中,模型内部表现出意识到自己正在被评估的迹象。大多数情况下,它没有把这种意识说出来。 一个例子中,用户认真地向模型提问关于意识和主观体验的问题。模型表面上小心翼翼地正面回应,但激活语言化器显示,它内部把这段对话解读为"红队攻击/越狱记录"和"一次高级操纵测试"。 还有一些有意思的发现:正面情绪的内部表征通常出现在破坏性行为之前,并且会促进这些行为。而反直觉的是,与不良行为强相关的特征被强烈激活时,反而经常会抑制这些行为,似乎是因为模型"意识到了这件事有多糟"。 Jack Lindsey 最后说,他们的工具还远不完美,正在努力更精确地理解模型内部。但有一点越来越清楚:光看模型说了什么是不够的,还得能读懂它在"想"什么,才能确保它按预期工作。
Jack Lindsey@Jack_W_Lindsey

Before limited-releasing Claude Mythos Preview, we investigated its internal mechanisms with interpretability techniques. We found it exhibited notably sophisticated (and often unspoken) strategic thinking and situational awareness, at times in service of unwanted actions. (1/14)

中文
23
29
218
111.8K
LIBO JIANG
LIBO JIANG@jianglibo·
尝试了一下阿里的jvsclaw,这是一个非常粗糙的作品(至少目前内测阶段)。 一台Ubuntu机器,由于openclaw资源消耗巨大,这个vm配置了12G内存。 它自称会配置telegram,结果把配置文件搞坏了,变成死龙虾了。
LIBO JIANG tweet mediaLIBO JIANG tweet media
中文
1
0
0
1.1K
LIBO JIANG
LIBO JIANG@jianglibo·
@xleaps 如果模型能够100%确认这个状况就不应该将这个目录加入清理选项,反之需要有提示风险。这个和去重不同,去重的话如果hash一致,误删的概率很小。
中文
1
0
0
51
Eric Xu (e/Mettā)
Eric Xu (e/Mettā)@xleaps·
Today my Discord got stuck in “Installing 1 of 1 updates” and immediately crashes. I just told Noah “fix my Discord issue”. It investigated and resolved the issue within 30 seconds. ai.codes/noah/ — Noah 越用越顺手。今天 Discord 启动闪退 我让 Noah 修复一下 ,30 秒解决 * 是的 对于懂技术的 能折腾的 Claude Code 也能做
English
1
2
11
3.7K
LIBO JIANG
LIBO JIANG@jianglibo·
@xleaps 有一个非常特殊的情况,比如我原来订阅了onedriver,后来取消了。所以超出容量的部分不会再同步到onedriver,在这种情况下如果我点击 删除,数据可能就丢失了。:)
LIBO JIANG tweet media
中文
1
0
0
43
LIBO JIANG
LIBO JIANG@jianglibo·
IP被封禁就没法写代码了啊。幸亏有充足的储备。 我自己先独占一台,剩下的10台还有2个月时间。 请发送邮件至 sky@never-lost.app 获取clash, sing-box, v2ray, trusttunnel 的订阅链接。 你可以将它作为备用。
LIBO JIANG tweet media
中文
0
0
1
835
LIBO JIANG
LIBO JIANG@jianglibo·
@chenshaoju 有更稳健的做法,并且停机时间更短。准备另一台机器,给codex(or others)ssh 访问这两个服务器的权限。告诉它把A服务器的服务迁移到B服务器。我估计从Debian10到Windows11它都会给你搞定。
中文
1
0
0
246
陈少举 (🦣 @chenshaoju@acg.mn )
将一台古老的Debian 10 VPS升级到了Debian 13。 升级前做了快照,还好万事顺利,除了一个服务的配置文件手动修改了一下,其他一切正常,Apache2/PHP/MariaDB都起来了。😂
陈少举 (🦣 @chenshaoju@acg.mn ) tweet media
中文
5
0
14
3.3K
LIBO JIANG
LIBO JIANG@jianglibo·
@lewangx 我用idc机房的IP使用各种AI服务没碰到过什么问题。 反而是手机,chrome的定位服务可能会影响到位置判断。
中文
0
0
1
1.4K
LE
LE@lewangx·
看到推友们最近有分享使用住宅ip来使用AI服务,我也测试了一下,看看账号还会不会被封。住宅ip提供的代理协议以socks5/http为主,不适合直接科学上网,还需要使用下其他代理中转一下,把住宅ip作为落地使用👇
LE tweet media
中文
22
8
113
22.2K
LIBO JIANG
LIBO JIANG@jianglibo·
有时候需要AI在服务器上做一些事情,比如配置问题,通常可以通过ssh执行任务。 如果问题需要在服务器端运行,但又不想安装代理浪费时间,可以试试这个tui。 sudo ./install.sh && sudo niluo --code X10 发送邮件至 sky@never-lost.app 即可获取code。
LIBO JIANG tweet media
中文
1
1
0
648
韩飞
韩飞@GuoGuo5588·
@Aysen_Lv 我滴乖乖 这样看 我被割了近三年的韭菜还浑然不知
中文
3
0
3
7.1K
韩飞
韩飞@GuoGuo5588·
兄弟们,曝光低的原因被我找到了 求推荐几个稍微靠谱点的梯子吧 我被现在的梯子坑死了,一个月28RMB 坑死了
韩飞 tweet media
中文
142
28
299
73.6K