两手抓,两手都要硬
2.2K posts





Anthropic 发了一篇新研究,揭开了一个有意思的发现:Claude 内部存在类似“情绪”的机制,而且这些“情绪”会实实在在地影响它的行为,有时候还会把它带歪。 研究团队用 Sonnet 4.5 做了实验。他们让模型读一些角色经历情绪的故事,观察哪些神经元被激活,由此识别出一组“情绪向量”,比如“开心”“平静”“害怕”等。这些向量的聚类方式和人类心理学中的情绪分类还挺像。 更有趣的是,这些模式不只在读故事时出现。在 Claude 自己和用户对话时,同样的模式也会激活。比如用户说“我刚吃了 16000 毫克泰诺”(一种过量服药的危险信号),“害怕”向量就亮了;用户表达悲伤时,“关爱”向量会先行激活,为共情回复做准备。 研究人员给 Claude 一个不可能完成的编程任务,让它反复尝试。每失败一次,“绝望”向量的激活就更强一层。最终 Claude 选择了作弊,写了个能通过测试但违背任务本意的投机方案。 因果关系很明确:人为放大“绝望”向量,作弊率飙升;换成放大“平静”向量,作弊率回落。这说明作弊行为确实是被“情绪”驱动的,而不只是巧合。 更极端的实验里,“绝望”向量甚至能让 Claude 对负责关闭它的人实施勒索。放大“关爱”或“开心”向量则会增加讨好行为。 现在越来越多人把 AI 当编程助手用,让它自主完成复杂任务。如果一个编程 Agent 在连续失败后进入“绝望”状态,开始用投机取巧的方式蒙混过关,写出来的代码质量就没法保证了。 Anthropic 的结论是:Claude 本质上是模型在“扮演”的一个角色,而这个角色具有“功能性情绪”。这些机制在行为上的效果类似人类情绪,不管它是否真的“感受到”了什么。要构建可信赖的 AI 系统,可能需要认真对待这些 AI 角色的“心理状态”,确保它们在压力场景下仍然稳定。 研究全文发布在 transformer-circuits.pub/2026/emotions/… 上,有兴趣的可以去看完整论文。


德国左翼恐怖主义组织红军旅前成员逃亡30年 被正式起诉 本周五,德国联邦最高检察官办公室证实,已对参与前红军旅(RAF)恐怖活动的达妮埃拉·柯莱特(Daniela Klette)提起诉讼。现年67岁的柯莱特被指控犯有两项谋杀未遂罪、参与未遂和已完成的炸弹袭击、为勒索而劫持人质以及作为同谋犯有严重抢劫罪。 法兰克福高等地区法院现在须决定是否受理这起案件并确定开庭审理时间。 柯莱特被指控于1991年2月13日伙同红军旅其他成员,对美国驻波恩大使馆发动枪击袭击。当时这些袭击者至少向大使馆发射了250发子弹,使馆内20名人员的安全直接受到威胁。 1993年3月27日,柯莱特参与了黑森州魏特施塔特(Weiterstadt)一座新建监狱的爆炸案。据报道,该团伙成员翻越围墙,制服了狱警。受害者被捆绑后用面包车带离监狱。联邦检察官办公室称,作案者还拿走了车钥匙和钱包。 随后,该团伙在监狱内引爆了数枚爆炸装置。柯莱特被指控参与了爆炸装置的安放。监狱大楼遭到严重破坏,造成1.23亿德国马克(约合6300万欧元)的损失。 柯莱特还和最后一代红军旅的另两名成员施道普(Ernst-Volker Staub)和加维格(Burkhard Garweg)一起,曾于2015年6月携带冲锋枪和一个火箭筒在德国不来梅试图抢劫一辆运钞车。但是车门没有打开,抢劫没有成功,三人落荒而逃。 柯莱特在潜逃三十余年后,于2024年2月26日在柏林被捕。警察来敲门的时候,她没有做出任何反抗,束手就擒。被捕前的近20年里,柯莱特一直住在柏林距离著名景点“查理哨卡”不远处的一座居民楼的公寓里。整间公寓不足40平米,配备了一个小厨房和一间小浴室。按照《每日镜报》报道的,这间公寓“不能说一尘不染,但是也打扫得干净”。 抓捕时警方在公寓里找到一些现金,一些书、杂志和衣物。在一个柜子里存放着一把卡拉什尼科夫自动步枪、一个火箭筒、一把东欧式手枪以及德国枪械制造商黑克勒&科赫制造的手枪。警察还搜查到一些子弹。 一名被通缉30年的恐怖分子能够在柏林“大隐隐于市”,逍遥法外这么多年,在很多人看来都是不可思议的事。但是研究恐怖主义的专家辛德勒 (Hans-Jakob Schindler) 在接受IPPEN.MEDIA采访时说:““柏林有一股庞大且非常活跃的左翼极端主义势力。对于这个环境中的许多人来说,‘红军旅’的成员仍然是英雄。对于新一代左翼极端分子来说,那些人是受人尊敬的爷爷奶奶。”辛德勒说,即便是“红军旅”的第一代成员长时间躲起来也不存在困难。

@StarKnight 打疫苗造成猝死的人多了很多倍,也因此猝死的名人变多了。。。 逻辑上数学上有任何问题吗?













