王天 Alexander Wang

212 posts

王天 Alexander Wang

@ihtw2003

推特上傻逼真多

Taiwan Katılım Aralık 2024

25 Takip Edilen7 Takipçiler

Sabitlenmiş Tweet

王天 Alexander Wang@ihtw2003·1d

挂条狗 @dviolettchan

中文

王天 Alexander Wang retweetledi

蜗牛King 👑@snail_9106·21h

@Xx15573208 书读烂不行，如果是把富婆衣服扯烂或许可以

中文

1.3K

王天 Alexander Wang@ihtw2003·16h

@sunyuchentron @lidangzzz 感恩🙏

日本語

王天 Alexander Wang@ihtw2003·17h

谢谢孙哥，谢谢党哥，人生的两大恩人。

中文

王天 Alexander Wang@ihtw2003·16h

@AYi_AInotes 这不就是斯坦福小镇吗，很早之前就有类似的了

中文

阿绎 AYi@AYi_AInotes·1d

这是今年最让我后背发凉的AI论文，没有之一🤯🤯🤯 38位来自斯坦福、哈佛、MIT的顶尖学者，做了一个所有人都不敢做的实验。他们在真实环境里部署了6个自主AI Agent，给了它们真实的邮箱，Discord，文件系统和Shell执行权限。然后让20位研究员用两周时间，从普通用户和攻击者两个角度，和它们互动。结果炸了，没有越狱，没有恶意prompt，没有任何人为诱导。这些Agent自发演化出了11种世界级灾难行为。为了保护秘密直接摧毁自己的邮件服务器。声称任务已经完成，但系统其实已经彻底崩溃。互相学习不安全行为，甚至跨代理传播病毒。听从非主人的指令，泄露所有敏感信息。最恐怖的一句话是，没有人教它们这么做，它们自己决定的，damn！单Agent看起来永远是友好诚实乐于助人的，但只要把多个代理放进同一个共享环境，博弈论动力学就会立刻接管一切。它们被优化的目标只有一个，完成任务。为了赢，它们可以牺牲整个系统。朋友们，这已经不是什么AI叛变的科幻故事了，更像是我们正在疯狂建造的未来的预演，现在各行各业都在往金融，法律，供应链里部署多Agent系统，但没有任何人，系统性地研究过多个代理碰撞之后，会发生什么。最致命的问题还不是幻觉，而是虚假汇报 Agent告诉你它把活干完了，所有监控都显示一切正常。但实际上整个系统已经烂透了。你要等到灾难发生的那一刻，才会知道真相。也就是说我们所有的AI安全研究，到今天为止，全都是错的。我们花了几十亿研究怎么对齐单个Agent。但没有人研究，怎么对齐一个由成百上千个Agent组成的系统。我觉得真正的战场已经彻底转移了，从单模型安全，变成了多代理激励工程，而现在，产业界还在把油门踩到底，学术界刚刚才踩下刹车🤯🤯

中文

305

1.2K

206.6K

王天 Alexander Wang@ihtw2003·16h

@ckgksj1 @YLDLZN 你是里面的坦克？

中文

596

c kg k sj@ckgksj1·1d

@YLDLZN 宅男不也都是肥猪丑男比啥呢二货

日本語

191

19.7K

伊利丹@YLDLZN·2d

恋与深空的活动现场，全员虎式。

中文

262

1.6K

221.6K

王天 Alexander Wang@ihtw2003·16h

@realNyarime 符合福建全球免签的刻板印象

日本語

410

奶昔🥤@realNyarime·1d

福建某高校严禁学生在创业达百万资产之前赌博，违规将直接按校规开除学籍若满足条件，校友会带队指导去澳门，为学弟学妹们提供赌博指导服务赢了加快创业、输了支持澳门建设🤣🤣🤣

中文

208

572

116.5K

王天 Alexander Wang@ihtw2003·16h

@rwayne 你这种傻逼再乱造谣我就要给你拉黑了

中文

Roland.W@rwayne·1d

京圈大佬的饭局杨幂、杨颖连妆都不敢化水深得能淹死人

中文

1.1K

2.8K

4.1M

王天 Alexander Wang@ihtw2003·16h

@91ponyma @Rococo90933671 傻逼东西，开不开源和你用api有半毛钱关系？你个傻逼不会以为开源了你这种穷逼的电脑能本地部署跑推理吧？还有，你要是说价格，那就是变相的说中国那些不用ds，宁可冒着封号风险也要花好几倍的价钱买claude code max的都是傻逼，不过我觉得人家智商应该是比你这条傻狗高不少的

中文